>

저널 초록, 저자, 제목 열이 포함 된 xlsx 파일이 있습니다. 추가 분석을 위해 데이터에서 데이터 프레임을로드하려고하지만 인코딩, 메모리 버퍼 문제와 같은 오류가 발생합니다. 그런 다음 저자 열만로드하려고했지만 오류는 동일합니다. 누구든지 해결책을 제안 할 수 있습니까?

샘플 데이터 세트

저자

{ '올리버 조나스': '매사추세츠 캠브리지 매사추세츠 공과 대학'}

{ 'Jia-Ren Lin': '매사추세츠 보스턴의 하버드 의과 대학;', '벤자민 이자르': '다나-파버 암 연구소, 하버드의 광범위한 연구소 및 메사추세츠 주 보스턴의 MIT;', '다니엘 트레이시 ':'매사추세츠 보스턴의 Dana-Farber Cancer Institute;','Marc Wadsworth '}


  • 답변 # 1

    다음을 시도했습니다 :

    파일 authors.xlsx :

    저자

    표를 편집하기 위해 LibreOffice Calc를 사용했지만 문서를 .xlsx로 저장했습니다

    그런 다음 pandas.read_excel을 사용하여 읽었습니다.

    import pandas as pd df = pd.read_excel('authors.xlsx')

    그런 다음 값을 올바르게 반환하는 열을 기준으로 데이터 프레임을 쿼리 할 수 ​​있습니다.

    에서 : 와이즈 비즈

    아웃 : 와이즈 비즈

    df['Name']

관련 자료

  • 이전 특정 시간에 실행되는 PHP 스크립트
  • 다음 Django 외래 키 필드에 추가하는 방법