>source

Lucene 색인이 있고 문서 텍스트는 '색인화되어 있지만'저장되지 않았습니다.

Luke v7.6.0을 사용하고 있으며 인덱스를 '시각화'하는 데 적합합니다.

문서 텍스트가 색인화되었지만 저장되지 않았기 때문에 '저장된'값을 복사하거나 쿼리 할 수는 없지만 색인화 된 텍스트 값을 클립 보드 또는 텍스트 파일로 추출하여 어떻게합니까? 내 파일에서 색인이 생성 된 내용을 정확하게 분석 하시겠습니까?

  • 답변 # 1

    사용 가능한 것 중 하나는 Lucene 색인 파일을 수동으로 확인하는 것입니다.

    가장 중요한 것은 용어 사전 파일 (* .tim)이라고 생각합니다

    저장된 값과 용어가없는 문서를 색인했습니다- [email protected]  필드 이메일 (표준분석기가있는TextField) 및 John  필드 이름 (StringField)

    이 후, 16 진 편집기로 팀 파일을 열고 다음과 같은 것을 볼 수있었습니다 :

    test, test, com 의 가치를 분명히 볼 수 있습니다  표준에 의해 토큰 화 된, 또한StringField를 사용했기 때문에 John이 여전히 동일하게 유지되는 것을 볼 수 있습니다. 다른 예에서, 소문자를 줄이는 작업도 볼 수있었습니다.

    반복하고 싶을 때 알림-작은 인덱스의 경우 기본적으로 Lucene은 모든 것을 복합 파일에 넣습니다.이 특정 디버그에는 바람직하지 않습니다. setUseCompoundFile (false)

    로이를 비활성화 할 수 있습니다.

  • 이전 jquery - 색인을 사용하여 행 삭제
  • 다음 apostrophe cms - showFields를 사용하여 배열에서 요소를 숨기는 방법