>source

PDF 문서에서 PDF 버전을 추출해야합니다. PDF 광부를 시도했지만 아래 정보 만 제공합니다.

  • PDF 생산자
  • 만들어진
  • 수정 됨
  • 신청
  • 아래는 내가 시도한 코드입니다.

    from pdfminer.pdfparser import PDFParser
    from pdfminer.pdfdocument import PDFDocument
    fp = open("ibs.servlets.pdf", 'rb')
    parser = PDFParser(fp)
    doc = PDFDocument(parser)
    parser.set_document(doc)
    if len(doc.info) > 0:
       info = doc.info[0]
       print(info)
    
    

    내가 사용할 수있는 pdf 마이너 외에 다른 라이브러리가 있습니까?

    • 답변 # 1

      PDF 버전은 PDF 파일의 첫 번째 줄에 주석으로 저장됩니다. pdfparser를 사용하여이 정보를 얻는 방법을 찾을 수 없었지만 PyPDF2를 사용하여이 정보를 수동으로 검색 할 수 있습니다.

      from PyPDF2.pdf import PdfFileReader
      doc = PdfFileReader('ibs.servlets.pdf')
      doc.stream.seek(0) # Necessary since the comment is ignored for the PDF analysis
      print(doc.stream.readline().decode())
      
      

      산출:

      %PDF-1.5
      
      
      

    관련 자료

  • 이전 Windows 10의 App Store에 React Native Expo 앱을 업로드하려면 어떻게해야합니까?
  • 다음 Pandas - 판다 - 최대 값으로 집계하는 어설 션 오류