Dieses kurze Tutorial erklärt den Prozess, wie man getaggte PDF mit Python erstellt. Es enthält die Ressourcen zum Einstellen der IDE, eine Liste mit Schritten für die Anwendung und einen ausführbaren Beispielcode zum Taggen von PDF-Dateien mit Python. Es wird eine Beschreibung bereitgestellt, um dem PDF-Dokument verschiedene Typen von gekennzeichneten Inhalten hinzuzufügen und die resultierende PDF-Datei auf der Festplatte zu speichern.
Schritte zum Hinzufügen von Tags zu PDF mit Python
- Legen Sie die Entwicklungsumgebung zum Taggen von PDF auf Verwenden Sie Aspose.PDF für Python über .NET fest
- Erstellen Sie eine PDF-Datei mit der Klasse Document und rufen Sie das Stammelement aus der Eigenschaft tagged content der Document-Klasse ab
- Legen Sie den Titel und die Sprache für den markierten Inhalt fest
- Erstellen Sie eine Überschrift und ein Absatzelement und legen Sie den Text fest
- Hängen Sie die Kopf- und Absatzelemente an das Stammelement an und speichern Sie die PDF-Datei
Diese Schritte umfassen den Prozess des Taggens von PDF-Dokumenten mit Python. Am Anfang wird das Stammelement des getaggten Inhalts aus der geladenen PDF-Datei abgerufen, gefolgt von der Einstellung des Titels und der Sprache des aufgerufenen getaggten Inhalts. Der getaggte Inhalt verfügt über die Methode create_header_element() zum Erstellen einer Kopfzeile und die Methode create_paragraph_element() zum Hinzufügen eines Absatzelements, das an das Stammelement des Dokuments angehängt wird.
Code zum Erstellen von getaggten PDFs mit Python
import aspose.pdf as pdf | |
# Load License | |
license = pdf.License() | |
license.set_license("Aspose.Total.lic") | |
# Create a PDF | |
document = pdf.Document() | |
# Get the tagged content and root element | |
taggedContent = document.tagged_content | |
rootElement = taggedContent.root_element | |
# Set Title and Language | |
taggedContent.set_title("A Pdf Document with tags") | |
taggedContent.set_language("en-US") | |
# Create a header and set the text | |
mainHeader = taggedContent.create_header_element() | |
mainHeader.set_text("Top Header") | |
# Create a paragraph and set the text | |
paragraphElement = taggedContent.create_paragraph_element() | |
paragraphElement.set_text("This is a sample text for the paragraph " + | |
"element that is appended to the root element later") | |
# Append header and paragraph to the root element | |
rootElement.append_child(mainHeader) | |
rootElement.append_child(paragraphElement) | |
# Save the tagged PDF Document | |
document.save("SampleTagged.pdf") | |
print("Tagged PDF created successfully") |
Dieser Code demonstriert den Prozess wie man mit Python Tags zu PDF hinzufügt. In diesem Beispielcode haben wir nur ein Kopf- und Absatzelement erstellt, während Sie create_annot_element(), create_art_element(), create_figure_element(), create_form_element() oder create_link_element() aus der langen Liste verfügbarer Methoden verwenden können, um die jeweiligen zu erstellen Elemente wie in den Methodennamen erwähnt.
Dieses Tutorial hat uns beigebracht, wie man mit Python Tags zu PDF-Dateien hinzufügt. Wenn Sie mehr über den Vorgang zum Zuschneiden von PDF-Seiten erfahren möchten, lesen Sie den Artikel zu wie man PDF-Seiten mit Python zuschneidet.