>

모든 "href"및 "src"속성을 찾아 해당 값에 "*/*.*" 와 같은 것이 포함되어 있는지 확인하는 것이 좋습니다. ? '/'는 아마도 고유해야합니다 ( "//"가 아님). 프로토콜 후에 시작시 사용할 수 있기 때문입니다.

쿼리가 더 복잡 할 것 같지만 올바른 방향으로 가고 있다고 생각하고 있습니까? 나는 C ++로 작성해야하며 아마도 libcurl을 사용할 것이지만 그 사실은 중요하지 않다고 생각합니다.

  • 답변 # 1

    결국 HTML5를 파싱하고 다음과 같이 URL을 포함하고있는 모든 속성을 반복합니다 :

    for (const string& attribute : { "action", "cite", "data", "formaction", "href", "manifest", "poster", "src" })
      iterate_attribute_occurrences_and_possibly_start_downloading(downloader, attribute, with_possible_URL);
    iterate_attribute_occurrences_and_possibly_start_downloading(downloader, "srcset", with_possible_comma_separated_URLs);
    iterate_attribute_occurrences_and_possibly_start_downloading(downloader, "style", with_CSS_possibly_containing_URLs_in_url_data_type);
    
    

  • 이전 Regex - 정규식 - java의 모든 sql 문에서 이러한 종류의 sql을 제외하는 방법은 무엇입니까?
  • 다음 javascript - 반응 라우터 v4에서 onEnter prop