홈>
이 텍스트가 있다고 상상해보십시오 (정규 표현식을 사용하여 HTML을 구문 분석하는 것이 올바른 해결책이 아니라는 것을 알고 있습니다 ...)
<div><p>HELLO1</p>
<span>SPIDER</span></div>
<div><p>HELLO2</p>
<span>CHEESE</span></div>
<div><p>HELLO3</p>
<span>BANANA</span></div>
<p>
내부의 텍스트와 일치 시키려고합니다
그리고
<span>
각각 (생각 된 예입니다)
다음을 사용하여 달성 할 수 있습니다 :
/<p>(.*?)<\/p>.*?<span>(.*?)<\/span>.*?<\/div>/gsmi
CHEESE
이면 일치하고 싶지 않습니다.
.
필자는 부정적인 예측을 사용하려고 시도했습니다.
/<p>(.*?)<\/p>.*?<span>((?!CHEESE).*?)<\/span>.*?<\/div>/gsmi
HELLO2
와 일치 할 때 잘못된 것과 일치합니다.
그리고
BANANA
어디
HELLO3
을 원하는
그리고
BANANA
나는 이것이
.*?
를 사용하기 때문에 이것이 깨달았다
그러나 이것은 실제 솔루션에 필요합니다.
예 : https://regex101.com/r/h4YgDm/3
전체 패턴 만 일치하지만 여러 줄에 걸쳐있는 방법은 무엇입니까?
- 답변 # 1
- 답변 # 2
내 동료가 나에게이 답변을 보냈습니다.
https://regex101.com/r/h4YgDm/8
정규식 :(?:(?:<div><p>(\w*)<\/p>\s)(?!<span>CHEESE<\/span>)(?:<span>(\w*)<\/span>)<\/div>)
관련 자료
- sed - 여러 줄의 일치 패턴
- fiware orion - 동일한 ID 패턴으로 여러 생성 된 엔티티에 속성 추가
- active directory - Powershell은 Get-ADUser에서 문자열 패턴과 일치하는 속성 만 가져옵니다
- awk - 패턴을 검색하고 패턴 매칭 라인에서 다음 라인을 인쇄합니다
- r - 전체 데이터 프레임에서 여러 관측치를 Tally () ing
- 일치하는 여러 열이있는 Excel 시트로 새 데이터를 병합/가져 오는 방법
- dataframe - 여러 데이터 프레임간에 일치하는 값 조합을 찾으십니까? 아르 자형
- javascript - 여러 줄 (/ m) 플래그로 JS의 문자열 끝 일치
- linux - 유닉스 쉘 스크립트를 사용하여 여러 열을 비교하고 일치하지 않는 열을 인쇄하는 방법
- java - =와 \ s 사이의 전체 텍스트 문자열을 추출하는 패턴의 모든 발생에 대한 정규식
- regex - SQL 하위 문자열 패턴 일치 (TERADATA)
- text processing - 여러 줄 패턴을 문자로 대체
- python - 서로 다른 그룹의 패턴을 일치시키는 Groupby
- agda - std-lib : 목록 : snoc과 일치하는 패턴
- awk - grep을 사용하여 파일에서 파이썬 여러 줄 식 문자열과 일치합니까?
- python - 여러 행을 일치시켜 Pandas 데이터 프레임 정렬
- haskell - 패턴이 함수 목록과 일치 할 때 (Eq ([a]-> [a])) 인스턴스 없음
- python - spacy - 패턴 매칭
- 암시 적 유형과 일치하는 Haskell 패턴
- linux - 사용자 정의 데이터 형식화 및 패턴 일치
관련 질문
- McDonald를 분할하지 않고 Regex로 camelCase를 분할하려면 어떻게해야합니까?
- java : 특정 문구 후에 다중 줄 문자열에서 일치하는 것을 regex
- python : 두 가지 다른 경우에 정규식을 사용하십시오
- php : 정규식 수수께끼. 결과를 원합니다 : '1 2 3', '하나 2', '두 3'이지만 '둘'하지는 않습니다. 긍정적 인 룩 하드 어쩌면?. 통화 추출을 위해
- regex : 두 개의 다른 로그 항목에서 캡처 그룹 추출을위한 정규식
- python : 정확한 단어로 문장을 일치시키고 다른 단어가 발생하면 무시하는 파이썬 정규 표현식
- regex : Google Forms에서 암호 확인을위한 정규식
- Regex Help ... 하위 문자열이 포함 된 경우를 제외하고 특정 문자열을 일치시킵니다.
- RegEx를 사용하여 반복 브래킷 사이의 내용을 삭제합니다
- 정규식 : 견적 분리 된 문자열 사이의 모든 쉼표 제거 [Python]
두 단계로 원하는 것을 달성 할 수 있습니다. 첫째,
div
를 추출 다음과 같은 기준을 충족하는 요소 (예 : 치즈 없음) (demo) :둘째,
p
사이의 내용을 선택하십시오 그리고span
태그를 두 그룹으로 표시 (데모) :