이 빠른 자습서에서는 Python을 사용하여 PDF 메타데이터를 읽는 방법을 설명합니다. 응용 프로그램 개발을 위한 환경을 설정하기 위한 자세한 정보, 단계별 절차 및 Python을 사용하여 PDF에서 메타데이터를 추출하기 위한 실행 가능한 샘플 코드가 포함되어 있습니다. Python 지원 환경에서 타사 도구를 설치하지 않고 API 호출을 거의 사용하지 않고 애플리케이션을 작성하고 PDF에서 메타데이터 정보에 액세스하는 것이 얼마나 쉬운지 배우게 됩니다.
Python을 사용하여 PDF 메타데이터를 읽는 단계
- 메타데이터를 읽으려면 환경을 .NET을 통해 Python용 Aspose.PDF 사용로 설정하세요.
- Document 클래스 개체를 사용하여 소스 PDF 파일을 로드하여 메타데이터를 가져옵니다.
- PDF 메타데이터를 포함하는 DocumentInfo 클래스 개체에 대한 액세스 권한을 얻으십시오.
- 몇 가지 정보 속성에 액세스하여 콘솔에 표시
이 단계에서는 Python을 사용하여 PDF 메타데이터를 보는 프로세스를 설명합니다. 먼저 대상 PDF 파일을 로드한 다음 Document 클래스에서 ‘Info’라는 DocumentInfo 속성에 액세스해야 합니다. 이 개체에는 작성자, 수정 시간대, 제작자, 생성 날짜 및 수정 날짜와 같은 PDF의 모든 메타데이터가 있습니다.
Python을 사용하여 PDF 메타데이터를 가져오는 코드
이 코드는 Python*을 사용하여 *PDF 메타데이터를 가져오는 절차를 보여줍니다. DocumentInfo 클래스 개체는 트랩된 플래그, 제목, 주제, 문서의 키워드 및 작성자와 같은 많은 메타데이터 정보가 있는 로드된 문서에서 액세스됩니다. 이러한 속성을 추가하려면 DocumentInfo.add() 메서드를 사용하고, clear() 메서드를 사용하여 메타데이터를 지우고, remove() 메서드를 사용하여 지정된 메타데이터만 제거할 수 있습니다.
이 문서에서는 PDF에서 메타데이터를 검색하는 프로세스를 설명했습니다. PDF 내용을 읽는 과정을 알고 싶다면 Python에서 PDF 콘텐츠를 읽는 방법의 글을 참고하세요.