홈>
저는 위키 백과 페이지 에서 2018 년 1 월부터 3 월까지 2018 년 영화를 찾으려고했습니다. 팬더를 사용하여 HTML을 읽습니다.
내 코드는 다음과 같습니다 :
import pandas as pd
import numpy as np
link = "https://en.wikipedia.org/wiki/2018_in_film"
tables = pd.read_html(link)
jan_march = tables[5].iloc[1:]
jan_march.columns = ['Opening1','Opening2','Title','Studio','Cast','Genre','Country','Ref']
jan_march.head()
열을 읽는 데 약간의 오류가 있습니다. 누군가 이미 일부를 긁었다면 wikipedia 테이블은 문제 해결에 도움이 될 수 있습니다.
많이 감사합니다.
관련 링크 :
선택적으로 Python을 사용하여 Wikipedia 테이블 스크 레이 핑
https://roche.io/2016/05/scrape-wikipedia-with- 파이썬
파이썬 팬더 및 beautifulSoup으로 페이지 매김 된 웹 테이블 긁기
나는 이것을 얻는다 :
그러나 기대하고 있습니다 :
- 답변 # 1
관련 자료
- python - pandas excelwriter를 사용하여 xlsx에서 데이터를 추출하고 pil을 사용하여 이미지에 텍스트로 출력
- JQuery를 사용하여 동적 HTML 테이블에서 선택한 행 값을 얻는 방법은 무엇입니까?
- python - Pandas 데이터 프레임의 모든 것을 SQL Server의 테이블에 어떻게 삽입 할 수 있습니까?
- mysql - 다른 테이블에서 선택하기 위해 테이블에서 시간 간격 사용
- sql - 한 테이블을 사용하여 조인없이 다른 테이블 필터링
- 명령 줄을 사용하지 않고 파이썬 파일을 실행할 수있는 방법이 있습니까?
- pysocks python을 사용하여 https reuqest를 보내는 방법
- Python Pandas DF 인덱스로 NaN을 다른 DF의 값으로 대체
- embedded - python을 사용하는 trace32 - t32_readmemoryobj 함수에서 반환 데이터를 해석하는 방법
- For 루프, 논리 오류를 사용하여 파이썬에서 정수 반복
- flux - Python을 사용하여 Influxdbv2 데이터를 쿼리 할 수없는 이유는 무엇입니까?
- python - 다른 함수를 행으로 사용하는 Pandas DataFrame
- Python Pandas는 여러 열로 그룹화하고 추가
- pip - ctypes를 사용하여 파이썬 모듈 만들기
- Python 요청을 사용할 때 잘못된 URL
- mysql 및 php를 사용하는 두 테이블의 mysql db의 우선 순위 기반 결과
- 항상 두 번째 항목을 제외하고 셀레늄 Python을 사용하여 웹 요소를 반복합니다
- Python Pandas nunique () 데이터 유형
- 나는 라이브러리 팬더를 사용하여 파이썬으로 그 코드를 작성하고 오류가 없었고 결과가 없었습니다 제발 도와 주시겠습니까? 결과는 그래프 여야합니다
- python - Pandas에서 열을 셀 값으로 사용
관련 질문
- python : 셀레늄 파이썬을 사용하는 Google 양식의 라디오 버튼
- python : 웹 파이썬에서 셀레늄으로 동적 웹 사이트 스크래핑
- Python에서 두 데이터 프레임을 수평으로 병합
- python : Pandas 데이터 프레임에 저장된 SMILE 구조를 RDKit에 직접 입력하여 분자 지문 및 유사성을 계산할 수 있습니까?
- python : Pandas를 사용하여 조건에 따라 열을 어떻게 합산합니까?
- python : 이동 평균 판다
- python : Pandas는 시간 간격에 따라 중복 된 행을 삭제합니다.
- Python Pandas는 행과 형식을 반복합니다.
- python : pandas-목록을 모듈로 열로 변환
- python : 데이터 프레임의 행을 통해 루프를 만들고 각 행에서 계산하고 다른 행으로 이동하는 방법은 무엇입니까?
테이블이 디자인 된 방식 때문에
pd.read_html()
만큼 단순하지 않습니다 시작하는 동안 원하는 형식으로 가져 오려면 약간의 조작을 수행해야합니다.아웃 :