Java에서 Word 파일에서 이미지를 추출하는 방법

이 빠른 자습서에서는 Java의 Word 파일에서 이미지를 추출하는 방법을 배웁니다. 여기에는 환경을 설정하는 데 필요한 모든 정보, 응용 프로그램 작성을 위한 API 사용에 대한 세부 정보, Java의 Word 문서에서 그림을 추출하는 프로세스를 보여주는 실행 가능한 샘플 코드가 포함되어 있습니다. 또한 소스 DOCX 파일을 로드하고 PNG, JPEG 등과 같은 다양한 이미지를 추출하는 동안 프로세스를 사용자 정의하는 다양한 옵션을 배우게 됩니다.

Java의 Word에서 이미지를 추출하는 단계

  1. 이미지 추출을 위한 Aspose.Words for Java 추가 환경 구축
  2. 이미지가 있는 소스 Word 파일을 Document 클래스 개체에 로드
  3. Document 클래스의 getChildNodes() 메서드를 사용하여 도형 컬렉션 가져오기
  4. 컬렉션의 모든 모양을 반복합니다.
  5. Shape 클래스의 hasImage() 메서드를 사용하여 모양에 이미지가 있는지 확인합니다.
  6. 이미지를 디스크에 별도의 파일로 저장

이 단계에서는 Java의 Word 파일에서 이미지를 추출하는 프로세스를 설명합니다. 먼저 환경 구축을 위해 자원을 공유한 후, Document 클래스를 사용하여 소스 Word 파일을 로드하고 getChildNodes() 메소드를 사용하여 모든 작업을 수행하는 데 필요한 클래스, 메소드 및 속성을 소개합니다. 그것에서 이미지. 마지막으로 컬렉션의 각 요소는 이미지가 있는지 테스트하고 발견된 경우 별도의 이미지 파일로 디스크에 저장됩니다.

Java의 Word 문서에서 이미지를 추출하는 코드

이 샘플 코드는 Java의 Word 문서에서 모든 이미지를 추출하는 프로세스를 보여줍니다. 원본 Word 파일을 로드한 후 NodeType.SHAPE 값을 인수로 제공하여 getChildNodes() 메서드를 사용합니다. Shape 클래스에는 이미지의 존재를 확인하는 hasImage() 메서드가 있기 때문에 문서의 모든 모양 집합을 반환하는 인수로 제공됩니다. . 이미지가 감지되면 shape.getImageData().getImageType()을 사용하여 확장자를 검색하고 유형에 따라 이미지를 필터링하는 옵션과 함께 출력 이미지 이름에 사용됩니다.

이 튜토리얼에서는 Java를 사용하여 MS Word에 그림을 삽입하는 방법을 배웠습니다. Word 문서를 처음부터 만드는 방법을 배우려면 Java를 사용하여 Word 문서를 만드는 방법 문서를 참조하세요.

 한국인