>

이클립스를 사용하여 UIMA Ruta에서 작업하고 있는데, 여기서는 텍스트를 가져 오기 위해 어노 테이터를 작성했지만 어노 테이터는 필수 텍스트를 강조 표시하지만 Ruta (어노 테이터 규칙 준수)에 의해 작성된 출력 파일은 XML 형식입니다. 별도의 텍스트 파일로 주석의 출력을 생성하는 방법을 알고 싶습니다.

Ruta 쿼리를 사용하여 출력을 얻으려고했지만 결과가 새 팝업 창에 표시되어 출력을 저장하지 않고 문서를 참조하여 출력을 수동으로 저장해야한다는 것을 알게되었습니다.

주석의 출력 만 저장되는 텍스트 파일을 가져 오려고합니다.


  • 답변 # 1

    UIMA Ruta는 Apache UIMA 텍스트 처리 프레임 워크의 일부이므로 생성 된 주석을 Ruta와 별도로 저장하려면 UIMA를 사용하여 Ruta 생성 출력에서 ​​원하는 주석을 가져와야합니다.

    UIMA의 좋은 출발점은 여기에서 찾을 수 있습니다

    기본적으로 jCas가 있으면 필요한 주석을 다음과 같이 추출 할 수 있습니다.

    Collection<YourAnnotationType> annotations = JCasUtil.select(jCas, YourAnnotationType.class);
    
    
    여기서부터 annotations  (기능과 함께) 외부 CSV 파일로 저장할 수 있습니다.

관련 자료

  • 이전 xml - 네임 스페이스 URI를 xslt로 바꾸는 방법
  • 다음 sql - 여러 열을 특정 열 이름을 가진 열로 변환