Как создать PDF с тегами с помощью Python

В этом кратком руководстве объясняется, как создавать теги PDF с помощью Python. В нем есть ресурсы для настройки IDE, список шагов для приложения и исполняемый пример кода для тегирования PDF-файлов с помощью Python. Предоставляется описание для добавления различных типов содержимого с тегами в документ PDF и сохранения полученного файла PDF на диске.

Шаги по добавлению тегов в PDF с помощью Python

  1. Установите для среды разработки значение использовать Aspose.PDF для Python через .NET для пометки PDF
  2. Создайте файл PDF с помощью класса Document и получите корневой элемент из свойства тегированного содержимого класса Document.
  3. Установите заголовок и язык для помеченного содержимого
  4. Создайте заголовок и элемент абзаца и установите текст
  5. Добавьте элементы заголовка и абзаца к корневому элементу и сохраните файл PDF.

Эти шаги охватывают процесс маркировки PDF-документов с помощью Python. Вначале из загруженного PDF-файла получается корневой элемент размеченного содержимого с последующим заданием заголовка и языка доступного размеченного содержимого. Помеченный контент имеет метод create_header_element() для создания заголовка и метод create_paragraph_element() для добавления элемента абзаца, который добавляется к корневому элементу документа.

Код для создания PDF с тегами с использованием Python

import aspose.pdf as pdf
# Load License
license = pdf.License()
license.set_license("Aspose.Total.lic")
# Create a PDF
document = pdf.Document()
# Get the tagged content and root element
taggedContent = document.tagged_content
rootElement = taggedContent.root_element
# Set Title and Language
taggedContent.set_title("A Pdf Document with tags")
taggedContent.set_language("en-US")
# Create a header and set the text
mainHeader = taggedContent.create_header_element()
mainHeader.set_text("Top Header")
# Create a paragraph and set the text
paragraphElement = taggedContent.create_paragraph_element()
paragraphElement.set_text("This is a sample text for the paragraph " +
"element that is appended to the root element later")
# Append header and paragraph to the root element
rootElement.append_child(mainHeader)
rootElement.append_child(paragraphElement)
# Save the tagged PDF Document
document.save("SampleTagged.pdf")
print("Tagged PDF created successfully")

Этот код демонстрирует процесс добавления тегов в PDF с помощью Python. В этом примере кода мы создали только элемент заголовка и абзаца, тогда как вы можете использовать create_annot_element(), create_art_element(), create_figure_element(), create_form_element() или create_link_element() из длинного списка доступных методов для создания соответствующих элементы, указанные в именах методов.

В этом руководстве мы научились добавлять теги в PDF-файлы с помощью Python. Если вы хотите узнать, как обрезать страницы PDF, обратитесь к статье как обрезать страницы PDF с помощью Python.

 Русский