>

여기서 도움을 요청하는 것이 처음이므로 pls는 나를 먹지 않습니다.

내 손에는 정말 크고 지저분한 .xml 파일이 있습니다. 구조는 다음과 같습니다.

<SPEAKER N°001>ERROR</SPEAKER N°001>
<ORIGINAL N°001>
TEXT THAT INTERESTS ME1
TEXT THAT INTERESTS ME1
</ORIGINAL N°001>
<JAPANESE N°001>
ツートンカラーの群れはグルグルと回り続け、
三方向から催眠動画を見せられているかのような錯覚に
陥る戦刃だが、それでも、彼女の表情は凍ったままだ。
</JAPANESE N°001>
<TRANSLATED N°001>
</TRANSLATED N°001>
<COMMENT N°001>
</COMMENT N°001>
------------------------------------------------------------
<SPEAKER N°002>ERROR</SPEAKER N°002>
<ORIGINAL N°002>
TEXT THAT INTERESTS ME2
</ORIGINAL N°002>
<JAPANESE N°002>
寧ろ、この異様な状況を前に、【超高校級の軍人】は
一際心が平静になりつつある。
</JAPANESE N°002>
<TRANSLATED N°002>
</TRANSLATED N°002>
<COMMENT N°002>
</COMMENT N°002>
------------------------------------------------------------

이것은 약 백 번 반복됩니다.number>태그로 텍스트를 분리하고 다른 모든 것을 삭제해야하므로 최종 결과는 다음과 같습니다.

TEXT THAT INTERESTS ME1
TEXT THAT INTERESTS ME1
TEXT THAT INTERESTS ME2
...
TEXT THAT INTERESTS ME254

매크로와 검색/바꾸기 기능을 사용하는 아이디어가 있었지만, 제 인생에서 작동하지 못했습니다. 파일이 너무 길어서 수동으로 수행 할 수 없습니다. notepad ++를 사용하고 있지만 다른 프로그램으로 처리하기가 더 쉬운 지 알려주세요.

이 질문이 중복되면 죄송합니다.

  • 답변 # 1

    가는 방법이 있습니다 :

    Ctrl+H

    찾을 내용 : (?:(?!<ORIGINAL.+?>).)*<ORIGINAL.+?>\R*((?:(?!</ORIGINAL.+?>).)+)(?:</ORIGINAL.+?>(?:(?!<ORIGINAL.+?>).)*)

    교체 : $1

    확인사례 일치

    확인줄 바꿈

    확인정규 표현식

    확인 . matches newline

    모두 교체

    데모 및 설명

    스크린 캡처 (이전) :

    화면 캡처 (후) :

  • 답변 # 2

    파워 쉘에 케이크 조각 :)

    또한 : XML이 유효하지 않습니다.

    CTRL+R

    을 누르십시오.

    powershell 유형

    입력을 누르면 파란색 창이 나타납니다. 그렇지 않다면 당신은 리눅스에있을 것입니다 : P

    아래 줄을 입력하되 D:\t.txt 를 바꾸십시오  당신의 경로와 함께 :

    (Get-Content D:\t.txt -Raw ) | Select-String -Pattern "(?smi)<ORIGINAL.*?>(.*?)</ORIGINAL" -AllMAtches | % {$_.Matches} | %{$_.Groups[1].ToString().Trim()}
    
    

    내 출력은

    TEXT THAT INTERESTS ME1
    TEXT THAT INTERESTS ME1
    TEXT THAT INTERESTS ME2
    
    

  • 이전 python - tensorflow 그래프로 저장된 Keras Sequential 모델에 열차 운행이 누락 되었습니까?
  • 다음 angularjs - 지시문 속성을 제거해도 리스너가 제거되지 않습니다