In diesem kurzen Tutorial lernen wir wie man Bilder aus Word-Dateien in Java extrahiert. Es enthält alle Informationen, die zum Einrichten der Umgebung erforderlich sind, Details zur API-Nutzung zum Schreiben der Anwendung und einen ausführbaren Beispielcode, der den Prozess zum Extrahieren von Bildern aus Word-Dokumenten in Java demonstriert. Sie lernen auch verschiedene Optionen zum Anpassen des Prozesses kennen, während Sie die Quelldatei DOCX laden und verschiedene Bilder daraus wie PNG, JPEG usw. extrahieren.
Schritte zum Extrahieren von Bildern aus Word in Java
- Richten Sie die Umgebung ein, um Aspose.Words for Java zum Extrahieren von Bildern hinzuzufügen
- Laden Sie die Word-Quelldatei mit Bildern in das Klassenobjekt Document
- Rufen Sie die Formensammlung mithilfe der getChildNodes()-Methode in der Document-Klasse ab
- Durchlaufen Sie alle Shapes in der Sammlung
- Überprüfen Sie, ob die Form ein Bild enthält, indem Sie die hasImage()-Methode in der Shape-Klasse verwenden
- Speichern Sie das Bild als separate Datei auf der Festplatte
Diese Schritte erläutern den Vorgang zum Extrahieren von Bildern aus einer Word-Datei in Java. Zuerst werden die Ressourcen für die Einrichtung der Umgebung gemeinsam genutzt, gefolgt von der Einführung in die Klassen, Methoden und Eigenschaften, die zum Ausführen der Aufgabe erforderlich sind, wie z. B. die Klasse Document zum Laden der Word-Quelldatei und die Methode getChildNodes() zum Extrahieren aller die Bilder daraus. Schließlich wird jedes Element der Sammlung darauf getestet, ob es ein Bild hat, und wenn es gefunden wird, wird es als separate Bilddatei auf der Festplatte gespeichert.
Code zum Extrahieren von Bildern aus Word-Dokumenten in Java
Dieser Beispielcode demonstriert den Prozess zum Extrahieren aller Bilder aus einem Word-Dokument in Java. Nach dem Laden der Word-Quelldatei wird die Methode getChildNodes() verwendet, indem der Wert NodeType.SHAPE als Argument bereitgestellt wird, das den Satz aller Formen im Dokument zurückgibt, da die Shape-Klasse über eine Methode hasImage() verfügt, die die Existenz des Bilds überprüft . Sobald das Bild erkannt wurde, wird seine Erweiterung mithilfe von shape.getImageData().getImageType() abgerufen und im Ausgabebildnamen zusammen mit der Option zum Filtern der Bilder basierend auf ihren Typen verwendet.
In diesem Tutorial haben wir gelernt, wie man ein Bild in MS Word mit Java einfügt. Wenn Sie lernen möchten, wie Sie ein Word-Dokument von Grund auf neu erstellen, lesen Sie den Artikel Wie erstelle ich ein Word-Dokument mit Java?.