Dieses kurze Tutorial enthält Informationen zum Extrahieren aller Bilder aus einem Word-Dokument in Python. Es stellt alle Ressourcen zum Konfigurieren der Umgebung bereit und führt die wichtigen API-Konstrukte ein, die zum Ausführen der Aufgabe erforderlich sind, einschließlich der Klassennamen, Methoden und Eigenschaften. Sie können den Schritten folgen und ein vollständiges Programm schreiben, um Bilder aus einem Word-Dokument in Python zu extrahieren, wie das Extrahieren von Bildern aus einer DOCX-Datei und das Speichern als Bildtyp PNG, JPG usw. auf der Festplatte.
Schritte zum Extrahieren von Bildern aus Word-Dateien in Python
- Konfigurieren Sie die Umgebung so, dass Aspose.Words für Python über .NET zum Extrahieren von Bildern verwendet wird
- Laden Sie die Word-Quelldatei mit Bildern mithilfe des Klassenobjekts Document
- Rufen Sie mit der get_child_nodes()-Methode eine Liste aller Formen aus dem geladenen Dokument ab
- Analysieren Sie alle Elemente in der Formensammlung und erkennen Sie Bilder
- Erstellen Sie eindeutige Dateinamen für jedes erkannte Bild in der Formensammlung
- Speichern Sie das extrahierte Bild unter dem eindeutigen Namen auf der Festplatte
Diese Schritte beschreiben den Vorgang zum Extrahieren von Bildern aus Word-Dokumenten in Python durch Teilen der Umgebungskonfiguration und der Schritte zum Schreiben des Programms. Nachdem Sie die Umgebung eingerichtet haben, laden Sie die Word-Datei mit Bildern mithilfe des Document-Klassenobjekts und rufen Sie daraus die Sammlung aller Formen ab. Da die Shape-Klasse über Methoden zum Erkennen von Bildern verfügt, können Sie die Bilder extrahieren und unter dem angegebenen Namen auf der Festplatte speichern.
Code zum Extrahieren von Fotos aus Word-Dokument in Python
Hier wird der Code vorgestellt, der den Prozess zum Extrahieren von Bildern aus Word in Python durch Laden der Quelldatei mithilfe des Document-Klassenobjekts demonstriert, das viele Funktionen wie das Bereitstellen des Passworts für geschützte Dateien, das Festlegen der Codierung und das Anhängen der Warnung aufweist Callbacks zur Steuerung des Ladevorgangs. In ähnlicher Weise wird die Methode get_child_nodes() zum Extrahieren von Formen verwendet, Sie können jedoch auch andere Knoten wie Kopfzeilen, Fußzeilen, Tabellen, Kommentare, Fußnoten und Text usw. abrufen.
Dieser Artikel hat uns angeleitet, alle Fotos aus einer Word-Datei in Python abzurufen. Wenn Sie lernen möchten, wie Sie ein Foto in eine Word-Datei einfügen, lesen Sie den Artikel zu wie man Bilder in Word mit Python einfügt.