Python에서 PDF에서 이미지를 얻는 방법

이 항목에서는 구성 단계 및 실행 가능한 샘플 코드의 도움으로 Python의 PDF에서 이미지를 가져오는 방법에 대해 자세히 설명합니다. Python의 PDF에서 이미지를 PNG, JPEG 등과 같은 다양한 형식으로 가져오는 데 필요한 모든 필수 클래스와 메서드가 제공되므로 이 애플리케이션을 개발하는 데 활용할 수 있는 완전한 프로그램 코드가 공유됩니다. 또한 PDF 파일에서 이미지에 액세스한 후 생성된 이미지를 사용자 지정하여 프로세스를 향상시키는 다양한 옵션을 관찰합니다.

Python에서 PDF 이미지를 얻는 단계

  1. .NET을 통한 Python용 Aspose.PDF를 사용하여 PDF에서 이미지를 추출하도록 IDE 구성
  2. Document 클래스 개체를 사용하여 내부에 이미지가 있는 소스 PDF 파일에 액세스
  3. XImage 클래스 개체를 사용하여 페이지 리소스 내의 특정 이미지에 액세스
  4. 원하는 이미지의 이름을 사용하여 새 파일 스트림 생성
  5. 이미지를 디스크에 JPEG 파일로 저장

이 단계는 먼저 소스 PDF 파일을 연 다음 PDF 내의 특정 페이지에 액세스하는 단계별 접근 방식을 노출하여 Python에서 PDF에서 이미지를 가져오는 방법을 수반합니다. 각 PDF 페이지에는 색인을 통해 참조할 수 있는 이미지를 포함한 리소스 모음이 있습니다. XImage 클래스 개체의 인스턴스를 사용하여 필요한 이미지 참조에 액세스하면 메모리 스트림의 인스턴스를 사용하여 디스크에 이미지로 저장할 수 있습니다.

Python의 PDF에서 이미지를 가져오는 코드

이 코드는 Document 클래스 개체에 액세스한 다음 리소스 목록에 액세스하여 특정 페이지에서 원하는 이미지에 액세스하여 로드하여 Python에서 PDF에서 이미지를 가져오는 절차를 보여줍니다. 원하는 이미지에 액세스하면 이름을 바꿀 수 있고 문서 내의 참조를 변경할 수도 있습니다. 디스크에 파일로 저장하기 전에 이름, 너비, 높이와 같은 다양한 속성에 액세스하여 이미지를 필터링할 수도 있습니다.

이 예제는 PDF 페이지에서 이미지를 추출하도록 안내했습니다. PDF 파일에 워터마크를 추가하는 과정에 대해 알아보려면 Python에서 PDF에 워터마크를 추가하는 방법의 문서를 참조하세요.

 한국인