PDF 문서에서 PDF 버전을 추출해야합니다. PDF 광부를 시도했지만 아래 정보 만 제공합니다.
아래는 내가 시도한 코드입니다.
from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
fp = open("ibs.servlets.pdf", 'rb')
parser = PDFParser(fp)
doc = PDFDocument(parser)
parser.set_document(doc)
if len(doc.info) > 0:
info = doc.info[0]
print(info)
내가 사용할 수있는 pdf 마이너 외에 다른 라이브러리가 있습니까?
- 답변 # 1
관련 자료
- 파이썬을 사용하여 JSON 형식의 PDF 데이터를 얻지 못합니까?
- java - EclEmma 및 Eclipse를 사용하여 "범위 데이터가 수집되지 않았습니다"메시지 받기
- 명령 줄을 사용하지 않고 파이썬 파일을 실행할 수있는 방법이 있습니까?
- python (python -m httpserver)을 사용하여 로컬 서버에서 html 파일을 열려면 어떻게해야합니까?
- Python argparse를 사용하여 명령 줄 문제를 해결하는 방법은 무엇입니까?
- 파이썬에서 인덱스 함수를 사용하지 않고 목록에서 다음 요소 가져 오기
- python - 상속 된 클래스를 사용할 때 AttributeError 받기
- Python Flask에서 CSS 사용
- Ubuntu 2004 DEV 컴퓨터에 여러 Python 버전이 설치된 이유는 무엇입니까?
- Creating Mysql database with python - python으로 mysql 데이터베이스 만들기 - 1064 오류가 계속 발생합니다 (… '% s'근처에서 사용할 올바른 구문)
- embedded - python을 사용하는 trace32 - t32_readmemoryobj 함수에서 반환 데이터를 해석하는 방법
- pysocks python을 사용하여 https reuqest를 보내는 방법
- C #을 사용한 사용자 입력 후 Python 출력을 C #에 표시
- For 루프, 논리 오류를 사용하여 파이썬에서 정수 반복
- flux - Python을 사용하여 Influxdbv2 데이터를 쿼리 할 수없는 이유는 무엇입니까?
- pip - ctypes를 사용하여 파이썬 모듈 만들기
- Python 요청을 사용할 때 잘못된 URL
- 항상 두 번째 항목을 제외하고 셀레늄 Python을 사용하여 웹 요소를 반복합니다
- linux - Linx OS 릴리스 파일에서 OS 이름 및 버전 가져 오기
- 다른 파이썬 파일에 대한 오류없이 가져올 수없는 이유는 무엇입니까? ("부분적으로 초기화 된 모듈에는 속성이 없습니다")
PDF 버전은 PDF 파일의 첫 번째 줄에 주석으로 저장됩니다. pdfparser를 사용하여이 정보를 얻는 방법을 찾을 수 없었지만 PyPDF2를 사용하여이 정보를 수동으로 검색 할 수 있습니다.
산출: