Comment extraire toutes les images d'un document Word en Python

Ce tutoriel rapide contient des informations sur comment extraire toutes les images d’un document Word en Python. Il fournit toutes les ressources pour configurer l’environnement et présente les constructions d’API importantes qui sont nécessaires pour accomplir la tâche, y compris les noms de classe, les méthodes et les propriétés. Vous pouvez suivre les étapes et écrire un programme complet pour ** extraire des images d’un document Word en python ** comme extraire des images d’un fichier DOCX et l’enregistrer en tant que type d’image PNG, JPG, etc. sur le disque.

Étapes pour extraire des images d’un fichier Word en Python

  1. Configurez l’environnement pour utiliser Aspose.Words pour Python via .NET afin d’extraire des images
  2. Chargez le fichier Word source avec des images à l’aide de l’objet de classe Document
  3. Obtenir la liste de toutes les formes du document chargé à l’aide de la méthode get_child_nodes()
  4. Analysez tous les éléments de la collection de formes et détectez les images
  5. Créez des noms de fichiers uniques pour chaque image détectée dans la collection de formes
  6. Enregistrez l’image extraite sur le disque avec le nom unique

Ces étapes décrivent le processus pour extraire des images d’un document Word en Python en partageant la configuration de l’environnement et les étapes pour écrire le programme. Après avoir établi l’environnement, chargez le fichier Word avec des images à l’aide de l’objet de classe Document et récupérez-en la collection de toutes les formes. Comme la classe Shape a des méthodes pour détecter les images, vous pouvez extraire les images et les enregistrer sur le disque avec le nom spécifié.

Code pour extraire des photos d’un document Word en Python

Ici, le code est présenté qui illustre le processus pour * extraire l’image de Word en Python * en chargeant le fichier source à l’aide de l’objet de classe Document qui a beaucoup de fonctionnalités comme fournir le mot de passe pour les fichiers protégés, définir l’encodage et joindre l’avertissement rappels pour contrôler le processus de chargement. De même, la méthode get_child_nodes() est utilisée pour extraire les formes, mais vous pouvez également récupérer d’autres nœuds tels que les en-têtes, les pieds de page, les tableaux, les commentaires, les notes de bas de page, le corps, etc.

Cet article nous a guidés pour récupérer toutes les photos d’un fichier Word en Python. Si vous voulez apprendre le processus pour insérer une photo dans un fichier Word, référez-vous à l’article sur comment insérer une image dans Word en utilisant Python.

 Français