홈>
<올>
파일에 500 개의 URL이 있습니다.
이 URL에 나타나는 모든 링크를 추출해야합니다.
Lynx로 파일을 읽고 파일 내에서 링크를 추출하는 방법?
file.txt
의 샘플
아래, 행당 1 개의 링크 및 총 500 개의 행
https://itunes.apple.com/
https://play.google.com/
... 등등
-
답변 # 1
-
답변 # 2
전화 목록 .txt :
for i in $(cat list.txt) do lynx -accept_all_cookies -dump $i |grep "http" |sed -e "s/^.*http/http/" done
일부 파일의 출력을 리디렉션하는 것이 좋습니다.
관련 자료
- amazon s3 - AWS S3에서 csv 파일을 읽습니다금지
- javascript - pdf 파일에서 주석 읽기
- python - 파일에서 변수 호스트 이름을 읽습니다
- c# - 어디에서나 파일을 읽는 방법 (상대 경로)
- android - Flutter의 자산에서 txt 파일을 읽는 방법은 무엇입니까?
- c - 파일에서 2d string 형 배열로 단어 읽기
- c++ - 파일에서 클래스 배열로 데이터를 읽는 방법
- apache spark - AWS S3에서 CSV 파일 읽기
- java - txt에서 정수 배열로 파일을 한 줄씩 읽습니다
- 파일 c에서 읽기
- jenkins - 파이프 라인 내에서 로그 파일을 읽는 방법은 무엇입니까?
- Java NIO를 사용하여 중첩 된 zip 파일에서 파일을 읽는 방법
- javascript - ts 파일에서 js 파일의 상수를 읽는 방법
- c - 파일에서 변수로 연속적으로 read ()하는 방법
- c++ - 구분 기호가있는 텍스트 파일에서 읽기
- c# - 데이터가 구성되지 않은 텍스트 파일에서 읽는 방법은 무엇입니까?
- python - PC에있는 텍스트 파일에서 URL을 어떻게 읽을 수 있습니까?
- sed - 둘 다 같은 줄에있을 수있는 경우/begin /에서/end /까지 파일을 읽는 방법
- python - S3에서 KMS 암호화 파일 읽기
- Java 8을 사용하여 파일에서 데이터를 읽습니까?
다음은 개선 된 스크립트입니다.
lynx가 인식하는 모든 유형의 URL (예 : ftp 포함)을 허용합니다. 스크립트는 결과를 정렬하고 중복을 제거합니다 (lynx는 자체적으로 수행하지 않음).추가 정보 :
Lynx 사용자 안내서