Este tutorial rápido contiene información sobre cómo extraer todas las imágenes de un documento de Word en Python. Proporciona todos los recursos para configurar el entorno y presenta las construcciones de API importantes que se requieren para realizar la tarea, incluidos los nombres de clase, los métodos y las propiedades. Puede seguir los pasos y escribir un programa completo para extraer imágenes de un documento de Word en python como extraer imágenes de un archivo DOCX y guardarlo como un tipo de imagen PNG, JPG, etc. en el disco
Pasos para extraer imágenes de un archivo de Word en Python
- Configure el entorno para usar Aspose.Words para Python a través de .NET para extraer imágenes
- Cargue el archivo de Word de origen con imágenes usando el objeto de clase Document
- Obtenga una lista de todas las formas del documento cargado usando el método get_child_nodes()
- Analice todos los elementos de la colección de formas y detecte imágenes
- Cree nombres de archivo únicos para cada imagen detectada en la colección de formas
- Guarde la imagen extraída en el disco con el nombre único
Estos pasos describen el proceso para extraer imágenes de un documento de Word en Python al compartir la configuración del entorno y los pasos para escribir el programa. Después de establecer el entorno, cargue el archivo de Word con imágenes utilizando el objeto de clase Documento y obtenga la colección de todas las formas de él. Como la clase Shape tiene métodos para detectar imágenes, puede extraer las imágenes y guardarlas en el disco con el nombre especificado.
Código para extraer fotos de un documento de Word en Python
Aquí se presenta el código que demuestra el proceso para extraer una imagen de Word en Python cargando el archivo fuente usando el objeto de la clase Documento que tiene muchas características como proporcionar la contraseña para archivos protegidos, establecer la codificación y adjuntar la advertencia devoluciones de llamada para controlar el proceso de carga. De manera similar, el método get_child_nodes() se usa para extraer formas; sin embargo, también puede obtener otros nodos como encabezados, pies de página, tablas, comentarios, notas al pie y cuerpo, etc.
Este artículo nos ha guiado para obtener todas las fotos de un archivo de Word en Python. Si desea conocer el proceso para insertar una foto en un archivo de Word, consulte el artículo sobre cómo insertar una imagen en Word usando Python.