Dieses kurze Tutorial erklärt wie PDF-Metadaten mit Python gelesen werden. Es enthält detaillierte Informationen zum Festlegen der Umgebung für die Entwicklung der Anwendung, ein schrittweises Verfahren und einen ausführbaren Beispielcode zum Extrahieren von Metadaten aus PDF mit Python. Sie erfahren, wie einfach es ist, die Anwendung zu schreiben und auf die Metadateninformationen von PDF mit sehr wenigen API-Aufrufen zuzugreifen, ohne ein Drittanbieter-Tool in einer der von Python unterstützten Umgebungen zu installieren.
Schritte zum Lesen von PDF-Metadaten mit Python
- Richten Sie die Umgebung für Verwenden Sie Aspose.PDF für Python über .NET ein, um Metadaten zu lesen
- Laden Sie die PDF-Quelldatei mit dem Klassenobjekt Document, um Metadaten abzurufen
- Erhalten Sie Zugriff auf das Klassenobjekt DocumentInfo, das die PDF-Metadaten enthält
- Greifen Sie auf einige Informationseigenschaften zu und zeigen Sie sie auf der Konsole an
Diese Schritte beschreiben den Prozess zum Anzeigen von PDF-Metadaten mit Python. Zuerst müssen Sie die Ziel-PDF-Datei laden und dann auf die DocumentInfo-Eigenschaft mit dem Namen Info in der Document-Klasse zugreifen. Dieses Objekt enthält alle Metadaten im PDF wie Ersteller, Änderungszeitzone, Hersteller, Erstellungsdatum und Änderungsdatum.
Code zum Abrufen von PDF-Metadaten mit Python
Dieser Code demonstriert lediglich das Verfahren zum Abrufen von PDF-Metadaten mit Python. Auf das DocumentInfo-Klassenobjekt wird von dem geladenen Dokument aus zugegriffen, das eine Reihe von Metadateninformationen wie Trapping-Flag, Titel, Betreff, Schlüsselwörter des Dokuments und Autor enthält. Wenn Sie diese Eigenschaften hinzufügen möchten, können Sie die Methode DocumentInfo.add() verwenden, die Methode clear() verwenden, um die Metadaten zu löschen, und die Methode remove() verwenden, um nur bestimmte Metadaten zu entfernen.
In diesem Artikel wurde der Prozess zum Abrufen von Metadaten aus der PDF-Datei beschrieben. Wenn Sie mehr über den Prozess zum Lesen der PDF-Inhalte erfahren möchten, lesen Sie den Artikel zu wie man PDF-Inhalte in Python liest.