Cómo extraer imágenes de un archivo de Word en Java

En este tutorial rápido, aprenderemos cómo extraer imágenes de un archivo de Word en Java. Contiene toda la información necesaria para establecer el entorno, detalles del uso de la API para escribir la aplicación y un código de ejemplo ejecutable que demuestra el proceso para extraer imágenes de un documento de Word en Java. También aprenderá diferentes opciones para personalizar el proceso mientras carga el archivo fuente DOCX y extrae diferentes imágenes como PNG, JPEG, etc.

Pasos para extraer imágenes de Word en Java

  1. Establezca el entorno para agregar Aspose.Words for Java para extraer imágenes
  2. Cargue el archivo de Word de origen con imágenes en el objeto de clase Document
  3. Obtenga la colección de formas usando el método getChildNodes() en la clase Document
  4. Iterar a través de todas las formas de la colección.
  5. Verifique si la forma tiene una imagen usando el método hasImage() en la clase Shape
  6. Guarde la imagen como un archivo separado en el disco

Estos pasos explican el proceso para extraer imágenes de un archivo de Word en Java. En primer lugar, los recursos se comparten para el establecimiento del entorno, seguido de la introducción a las clases, los métodos y las propiedades necesarios para realizar la tarea, como la clase Documento que se utiliza para cargar el archivo de origen de Word y el método getChildNodes() se utiliza para extraer todo las imágenes de la misma. Finalmente, cada elemento de la colección se prueba para tener una imagen y, si se encuentra, se guarda en el disco como un archivo de imagen separado.

Código para extraer imágenes de un documento de Word en Java

Este código de muestra demuestra el proceso para extraer todas las imágenes de un documento de Word en Java. Después de cargar el archivo de origen de Word, se usa el método getChildNodes() al proporcionar el valor NodeType.SHAPE como argumento que devuelve el conjunto de todas las formas en el documento, ya que la clase Shape tiene un método hasImage() que verifica la existencia de la imagen. . Una vez que se detecta la imagen, su extensión se recupera usando shape.getImageData().getImageType() y se usa en el nombre de la imagen de salida junto con la opción de filtrar las imágenes según sus tipos.

En este tutorial, hemos aprendido cómo insertar una imagen en MS Word usando Java. Si desea aprender cómo crear un documento de Word desde cero, puede consultar el artículo cómo crear un documento de Word usando Java.

 Español