Dans ce rapide tutoriel, nous apprendrons comment extraire des images d’un fichier Word en Java. Il contient toutes les informations nécessaires pour établir l’environnement, les détails de l’utilisation de l’API pour écrire l’application et un exemple de code exécutable qui illustre le processus d’extraction d’images d’un document Word en Java. Vous apprendrez également différentes options pour personnaliser le processus lors du chargement du fichier source DOCX et de l’extraction de différentes images comme PNG, JPEG, etc.
Étapes pour extraire des images de Word en Java
- Établir l’environnement pour ajouter Aspose.Words for Java pour extraire les images
- Chargez le fichier Word source avec des images dans l’objet de classe Document
- Obtenez la collection de formes à l’aide de la méthode getChildNodes() dans la classe Document
- Parcourez toutes les formes de la collection
- Vérifiez si la forme a une image en utilisant la méthode hasImage() dans la classe Shape
- Enregistrez l’image dans un fichier séparé sur le disque
Ces étapes expliquent le processus pour extraire des images d’un fichier Word en Java. Tout d’abord, les ressources sont partagées pour l’établissement de l’environnement, suivies de l’introduction aux classes, méthodes et propriétés requises pour accomplir la tâche, comme la classe Document est utilisée pour charger le fichier Word source et la méthode getChildNodes () est utilisée pour extraire tous les images de celui-ci. Enfin, chaque élément de la collection est testé pour avoir une image, et s’il est trouvé enregistré sur le disque en tant que fichier image séparé.
Code pour extraire des images d’un document Word en Java
Cet exemple de code illustre le processus pour extraire toutes les images d’un document Word en Java. Après avoir chargé le fichier Word source, la méthode getChildNodes() est utilisée en fournissant la valeur NodeType.SHAPE comme argument qui renvoie l’ensemble de toutes les formes du document car la classe Shape a une méthode hasImage() qui vérifie l’existence de l’image . Une fois l’image détectée, son extension est récupérée à l’aide de shape.getImageData().getImageType() et utilisée dans le nom de l’image de sortie avec l’option de filtrer les images en fonction de leurs types.
Dans ce didacticiel, nous avons appris à insérer une image dans MS Word à l’aide de Java. Si vous souhaitez apprendre à créer un document Word à partir de zéro, vous pouvez vous référer à l’article comment créer un document Word en utilisant Java.