홈>
이 텍스트가 있다고 상상해보십시오 (정규 표현식을 사용하여 HTML을 구문 분석하는 것이 올바른 해결책이 아니라는 것을 알고 있습니다 ...)
<div><p>HELLO1</p>
<span>SPIDER</span></div>
<div><p>HELLO2</p>
<span>CHEESE</span></div>
<div><p>HELLO3</p>
<span>BANANA</span></div>
<p>
내부의 텍스트와 일치 시키려고합니다
그리고
<span>
각각 (생각 된 예입니다)
다음을 사용하여 달성 할 수 있습니다 :
/<p>(.*?)<\/p>.*?<span>(.*?)<\/span>.*?<\/div>/gsmi
CHEESE
이면 일치하고 싶지 않습니다.
.
필자는 부정적인 예측을 사용하려고 시도했습니다.
/<p>(.*?)<\/p>.*?<span>((?!CHEESE).*?)<\/span>.*?<\/div>/gsmi
HELLO2
와 일치 할 때 잘못된 것과 일치합니다.
그리고
BANANA
어디
HELLO3
을 원하는
그리고
BANANA
나는 이것이
.*?
를 사용하기 때문에 이것이 깨달았다
그러나 이것은 실제 솔루션에 필요합니다.
예 : https://regex101.com/r/h4YgDm/3
전체 패턴 만 일치하지만 여러 줄에 걸쳐있는 방법은 무엇입니까?
- 답변 # 1
- 답변 # 2
내 동료가 나에게이 답변을 보냈습니다.
https://regex101.com/r/h4YgDm/8
정규식 :(?:(?:<div><p>(\w*)<\/p>\s)(?!<span>CHEESE<\/span>)(?:<span>(\w*)<\/span>)<\/div>)
관련 자료
- sed - 여러 줄의 일치 패턴
- fiware orion - 동일한 ID 패턴으로 여러 생성 된 엔티티에 속성 추가
- active directory - Powershell은 Get-ADUser에서 문자열 패턴과 일치하는 속성 만 가져옵니다
- awk - 패턴을 검색하고 패턴 매칭 라인에서 다음 라인을 인쇄합니다
- r - 전체 데이터 프레임에서 여러 관측치를 Tally () ing
- 일치하는 여러 열이있는 Excel 시트로 새 데이터를 병합/가져 오는 방법
- dataframe - 여러 데이터 프레임간에 일치하는 값 조합을 찾으십니까? 아르 자형
- javascript - 여러 줄 (/ m) 플래그로 JS의 문자열 끝 일치
- linux - 유닉스 쉘 스크립트를 사용하여 여러 열을 비교하고 일치하지 않는 열을 인쇄하는 방법
- java - =와 \ s 사이의 전체 텍스트 문자열을 추출하는 패턴의 모든 발생에 대한 정규식
- regex - SQL 하위 문자열 패턴 일치 (TERADATA)
- text processing - 여러 줄 패턴을 문자로 대체
- python - 서로 다른 그룹의 패턴을 일치시키는 Groupby
- agda - std-lib : 목록 : snoc과 일치하는 패턴
- awk - grep을 사용하여 파일에서 파이썬 여러 줄 식 문자열과 일치합니까?
- python - 여러 행을 일치시켜 Pandas 데이터 프레임 정렬
- haskell - 패턴이 함수 목록과 일치 할 때 (Eq ([a]-> [a])) 인스턴스 없음
- python - spacy - 패턴 매칭
- 암시 적 유형과 일치하는 Haskell 패턴
- linux - 사용자 정의 데이터 형식화 및 패턴 일치
관련 질문
- regex : 사용자 이름에 @(필수 아님)를 허용하는 정규식, @가 있는 경우 유효한 이메일 형식이어야 합니다.
- Regex를 사용하여 첫 번째 항목 반환
- python : -또는 ' 1 이상으로 시작하는 단어를 무시하는 단어에 대한 정규식
- regex : 정규식 -데이터 스튜디오
- python : 정규식 또는 파이썬 함수를 사용하여 두 문자열의 모든 동일한 쌍 사이에 있는 모든 문자열을 추출합니다.
- c# : .NET Regex : 백 슬래시를위한 가변 길이 룩 윈드
- javascript : 정규식 : JSON의 블록을 포맷하기 위해 여러 LookBehinds를 사용하여
- javascript : Regex Microsoft Edge 및 Safari에 대한 대안을 찾습니다
- JavaScript Regex : 두 번째 블록 발생 : abc.js 음악 표기법
- regex : URL 끝에서 괄호 제외 방법
두 단계로 원하는 것을 달성 할 수 있습니다. 첫째,
div
를 추출 다음과 같은 기준을 충족하는 요소 (예 : 치즈 없음) (demo) :둘째,
p
사이의 내용을 선택하십시오 그리고span
태그를 두 그룹으로 표시 (데모) :