홈>
애플 스토어에서 정보를 긁어 내야합니다. 해시 맵
hashmap_genre_link
가 있습니다.
장르와 URL ({ 'Games': ' https : //itunes.apple.com/us/genre/ios-games/id6014?mt=8 ';...}), 각 키마다 iOS 앱 (텍스트)으로 다른 해시 맵을 만들고 싶습니다. 앱 URL 값 : games_apps : { 'Pokemon Go', ' https://itunes.apple.com/us/app/pokémon-go/id1094591345?mt=8 ': ...}.
내 코드는 다음과 같습니다 :
from bs4 import BeautifulSoup
from requests import get
links = []
ios_categories_links=[]
hashmap_genre_link ={}
url = "https://itunes.apple.com/US/genre/ios/id36"
response = get(url)
html_soup = BeautifulSoup(response.text,"html.parser")
categories_class = html_soup.find_all('div',class_="grid3-column")
# cat = categories_class.text
href = html_soup.find_all('a', href=True)
for j in href:
# print(j['href'])
links.append(j['href'])
#
# Hasmap initialisation : hashmap_genre_link = {"games" : "https://link_for_games_page"; etc...}
for i in links:
if "https://itunes.apple.com/us/genre/ios" in i:
genre = i.split("/")[5][4:] #We get the genre, without 'ios-'
hashmap_genre_link[genre] = i
ios_categories_links.append(i)
#print(hashmap_genre_link)
for the_key, the_value in hashmap_genre_link.items():
#print(the_key, 'corresponds to', the_value)
print("=======================")
print(the_key)
response_genre_link = get(the_value)
html_soup_genre_link = BeautifulSoup(response_genre_link.text,"html.parser")
genre_popular_apps_class = html_soup_genre_link.find_all('div',class_="grid3-column")
for x in genre_popular_apps_class:
print(x['href'])
출력의 일부입니다 :
=======================
games-family
<div class="grid3-column" id="selectedcontent">
<div class="column first">
<ul>
<li><a href="https://itunes.apple.com/us/app/trivia-crack/id651510680?mt=8">Trivia Crack</a> </li>
<li><a href="https://itunes.apple.com/us/app/minion-rush/id596402997?mt=8">Minion Rush</a> </li>
<li><a href="https://itunes.apple.com/us/app/draw-something-classic/id488628250?mt=8">Draw Something Classic</a> </li>
href 태그를 값으로 얻는 방법 (내가 아는 텍스트에는 .text를 사용할 수 있습니다
- 답변 # 1
관련 자료
- 파이썬에서 텍스트로 href 링크를 얻는 방법
- keyboard - 텍스트 키 바인딩 "yankAndSelect"가 작동하도록하려면 어떻게해야합니까?
- ruby on rails 5 - Capybara 노드 요소에서 텍스트 가져 오기
- xpath - 엉뚱한 텍스트로 태그없이 텍스트의 가치를 얻으십시오
- 자바 스크립트로 클립 보드에서 텍스트를 얻는 방법?
- 파이썬에서 XML 파일에서 텍스트를 얻는 방법은 무엇입니까?
- javascript - JSON 텍스트를 HTML로 얻는 방법?
- python - 사용자 정의 태그에서 href 태그를 얻는 방법
- excel - SAP PR의 첨부 파일에서 파일 이름 텍스트를 얻는 방법
- python - 주별 팬더 그룹 및 지난주 데이터를 새로운 df로 가져옵니다
- javascript - DOM에 액세스하지 않고 SVG에서 텍스트 크기 얻기
- tsql - Varchar 형식의 SQL에서 월 및 연도를 얻는 방법
- python - XML 문서에서 텍스트 가져 오기
- laravel - jQuery를 사용하여 td 텍스트를 가져 와서 컨트롤러로 보냅니다
- sql - Hive에서 문자열이 사용하는 텍스트 바이트를 얻는 방법은 무엇입니까?
- ios - SwiftUI에서 텍스트 너비 얻기
- xml parsing - Flutter의 XML에서 텍스트 값을 얻는 방법
- powershell - 텍스트에서 지정된 문자열을 얻는 방법
- bootstrap 4 - 한 줄에 텍스트를 표시하는 방법은 무엇입니까?
- python - except에 의해 작성된 텍스트를 어떻게 제거합니까?
트렌드
- OpenCv의 폴더에서 여러 이미지 읽기 (python)
- 파이썬 셀레늄 모든 "href"속성 가져 오기
- html - 자바 스크립트 - 클릭 후 변경 버튼 텍스트 변경
- git commit - 자식 - 로컬 커밋 된 파일에 대한 변경을 취소하는 방법
- JSP에 대한 클래스를 컴파일 할 수 없습니다
- javascript - 현재 URL에서 특정 div 만 새로 고침/새로 고침
- jquery - JavaScript로 현재 세션 값을 얻으시겠습니까?
- javascript - swiperjs에서 정지, 재생 버튼 추가
- JavaScript 변수를 HTML div에 '출력'하는 방법
- python - 문자열에서 특정 문자 제거
당신은
['href']
에 대한 올바른 생각을 가지고 해당 속성 값을 가져옵니다. 그러나이를 분리해야합니다. 당신의x
요소에는<a>
의 모든 href가 포함됩니다. 태그. 그래서 당신은 추가x.find_all('a')
를해야합니다 그런 다음 반복하여 각href
를 인쇄하십시오. 그<a>
각각에 대한 속성 태그.그래서 내가 추가 한 것 :
전체 코드 :
출력 :