4 시간 동안 노력한 후에는 시작했을 때보 다 더 가까이 있지 않습니다.
.html
를 추가하려고합니다
많은 html 문서에서 모든 링크의 끝에 (다른 확장자가없는). 내가하려는 목표의 예는 아래의두 개의 예제 링크 ...를 참조하십시오.
HTML 파일 모음이 많고 링크를 '수정'하여 내부 링크로 만들어서 오프라인에서 잘 작동하도록 노력하고 있습니다. (저는 언니가 시험 공부를하는 동안 오프라인으로 사이트를 사용할 수 있도록하기 위해 노력하고 있습니다). 사이트가 더 이상 온라인 상태가 아닙니다.
나는 간단한
SED
를 사용하여 그중 일부를 관리했습니다.
명령), 그러나 나는 가장 많이 붙어 있습니다.
두 번째 단계는 쉬울 것입니다 (maxdepth mindepth로 find를 사용하여 파일이 디렉토리 트리에 얼마나 깊이 있는지 확인한 다음
sed 's/https:\\/../../..//g'
),하지만 https가
.html
가 필요한 링크를 쉽게 찾을 수 있다고 추측하기 때문에이 비트를 두 번째로하고 싶습니다.
그들의 끝에 추가).
대부분의 링크는 href 태그에 있지만 전부는 아닙니다.
나는 일종의 SED 정규식을 사용해야 할 것이라고 생각하고 있으며, 다른 링크는 다르게, 아마도 여러 번의 SED를 처리해야하기 때문입니다. 하지만 SED는 제 전문 분야가 아닙니다.
두 개의 예제 링크 ...- 이 링크 :
pagespeed.addInstrumentationInit('/mod_pagespeed_beacon', 'beforeunload', '', 'https://www.example.com/learners/levels/2/lessons/13/stories/1','IF77dLwFOP',true,false,'ikd272iAGio');
다음으로 변경해야합니다 :
pagespeed.addInstrumentationInit('/mod_pagespeed_beacon', 'beforeunload', '', ../../../www.example.com/learners/levels/2/lessons/13/stories/1.html','IF77dLwFOP',true,false,'ikd272iAGio');
- 그리고 이것 :
<a href="https://www.example.com/learners">Home</a> <ul>
다음과 같아야합니다 :
<a href="../../../www.example.com/learners.html">Home</a> <ul>
위에서 언급했듯이, 나는 2 단계를 어떻게할지 알고 있지만, 4 시간 동안 시도한 후에도 첫 단계를 밟지 못했습니다. 와이즈 비즈
URL 목록을 인쇄하지만 이것이 어떻게 유용한 지 알 수 없습니다. 난 그냥
grep -Poh 'https://www.example[^"]*'
를 얻는 방법을 해결할 수 없습니다
SED
를 배치
올바른 장소에서.
어떤 힌트라도 대단히 감사하겠습니다!
.html
-
답변 # 1
관련 자료
- javascript - ajax를 사용하여 페이지 매김에서 페이지 링크를 어떻게 처리 할 수 있습니까?
- 신경망을 사용하여 문서의 정보를 감지하고 인식하는 방법은 무엇입니까?
- node.js - Cloud Firestore를 사용하여 컬렉션의 모든 문서 가져 오기
- Python docx2txt를 사용하여 Word 문서에서 이미지 추출
- Linux에서 PDF에 포함 된 문서에 대한 Javascript 링크
- abap - COND를 사용하여 내부 테이블에 일부 줄을 추가하지 않음
- mongodb - 집계를 사용하여 행의 특정 문서를 계산하는 방법은 무엇입니까?
- sed - grep 및 bash에서 여러 줄 값 바꾸기
- bash - grep 출력의 특정 부분을 어떻게 선택합니까?
- bash - sed 정규식 패턴 이해
- bash - 특정 특수 문자 $(가있는 행을 무시하도록 grep 명령을 작성하십시오
- unix - bash`ls` 출력에서 파일 이름을 하위 집합으로 만드는 방법
- linux - UNIX 명령 줄 도구를 사용하여 JSON을 여러 줄로 분할
- bash - 읽기 루프 추가 중
- bash - 쉘 스크립트를 사용하여 각 행의 첫 번째 쉼표를 제외한 모든 쉼표 제거
- linux - 두 포인트 후 정규식
- bash - 변수를 사용하여 sed로 바꿀 줄을 지정하는 방법
GNU awk 솔루션 :
분리 된 줄에 넣습니다 :
예 :