В этом кратком руководстве объясняется, как создавать теги PDF с помощью Python. В нем есть ресурсы для настройки IDE, список шагов для приложения и исполняемый пример кода для тегирования PDF-файлов с помощью Python. Предоставляется описание для добавления различных типов содержимого с тегами в документ PDF и сохранения полученного файла PDF на диске.
Шаги по добавлению тегов в PDF с помощью Python
- Установите для среды разработки значение использовать Aspose.PDF для Python через .NET для пометки PDF
- Создайте файл PDF с помощью класса Document и получите корневой элемент из свойства тегированного содержимого класса Document.
- Установите заголовок и язык для помеченного содержимого
- Создайте заголовок и элемент абзаца и установите текст
- Добавьте элементы заголовка и абзаца к корневому элементу и сохраните файл PDF.
Эти шаги охватывают процесс маркировки PDF-документов с помощью Python. Вначале из загруженного PDF-файла получается корневой элемент размеченного содержимого с последующим заданием заголовка и языка доступного размеченного содержимого. Помеченный контент имеет метод create_header_element() для создания заголовка и метод create_paragraph_element() для добавления элемента абзаца, который добавляется к корневому элементу документа.
Код для создания PDF с тегами с использованием Python
import aspose.pdf as pdf | |
# Load License | |
license = pdf.License() | |
license.set_license("Aspose.Total.lic") | |
# Create a PDF | |
document = pdf.Document() | |
# Get the tagged content and root element | |
taggedContent = document.tagged_content | |
rootElement = taggedContent.root_element | |
# Set Title and Language | |
taggedContent.set_title("A Pdf Document with tags") | |
taggedContent.set_language("en-US") | |
# Create a header and set the text | |
mainHeader = taggedContent.create_header_element() | |
mainHeader.set_text("Top Header") | |
# Create a paragraph and set the text | |
paragraphElement = taggedContent.create_paragraph_element() | |
paragraphElement.set_text("This is a sample text for the paragraph " + | |
"element that is appended to the root element later") | |
# Append header and paragraph to the root element | |
rootElement.append_child(mainHeader) | |
rootElement.append_child(paragraphElement) | |
# Save the tagged PDF Document | |
document.save("SampleTagged.pdf") | |
print("Tagged PDF created successfully") |
Этот код демонстрирует процесс добавления тегов в PDF с помощью Python. В этом примере кода мы создали только элемент заголовка и абзаца, тогда как вы можете использовать create_annot_element(), create_art_element(), create_figure_element(), create_form_element() или create_link_element() из длинного списка доступных методов для создания соответствующих элементы, указанные в именах методов.
В этом руководстве мы научились добавлять теги в PDF-файлы с помощью Python. Если вы хотите узнать, как обрезать страницы PDF, обратитесь к статье как обрезать страницы PDF с помощью Python.