Como criar PDF marcado usando Python

Este breve tutorial explica o processo de como criar PDF marcado usando Python. Possui os recursos para configurar o IDE, uma lista de etapas para o aplicativo e um código de amostra executável para marcar arquivos PDF usando Python. Uma descrição é fornecida para adicionar diferentes tipos de conteúdo marcado ao documento PDF e salvar o arquivo PDF resultante no disco.

Etapas para adicionar tags ao PDF usando Python

  1. Defina o ambiente de desenvolvimento como use Aspose.PDF para Python via .NET para marcar o PDF
  2. Crie um arquivo PDF usando a classe Document e obtenha o elemento raiz da propriedade de conteúdo marcado da classe Document
  3. Defina o título e o idioma do conteúdo marcado
  4. Crie um cabeçalho e um elemento de parágrafo e defina o texto
  5. Anexe o cabeçalho e os elementos do parágrafo ao elemento raiz e salve o arquivo PDF

Essas etapas abrangem o processo de marcar documentos PDF usando Python. No início, o elemento raiz do conteúdo marcado do arquivo PDF carregado é obtido, seguido pela definição do título e idioma do conteúdo marcado acessado. O conteúdo marcado tem o método create_header_element() para criar um cabeçalho e o método create_paragraph_element() para adicionar um elemento de parágrafo que é anexado ao elemento raiz do documento.

Código para criar PDF marcado usando Python

import aspose.pdf as pdf
# Load License
license = pdf.License()
license.set_license("Aspose.Total.lic")
# Create a PDF
document = pdf.Document()
# Get the tagged content and root element
taggedContent = document.tagged_content
rootElement = taggedContent.root_element
# Set Title and Language
taggedContent.set_title("A Pdf Document with tags")
taggedContent.set_language("en-US")
# Create a header and set the text
mainHeader = taggedContent.create_header_element()
mainHeader.set_text("Top Header")
# Create a paragraph and set the text
paragraphElement = taggedContent.create_paragraph_element()
paragraphElement.set_text("This is a sample text for the paragraph " +
"element that is appended to the root element later")
# Append header and paragraph to the root element
rootElement.append_child(mainHeader)
rootElement.append_child(paragraphElement)
# Save the tagged PDF Document
document.save("SampleTagged.pdf")
print("Tagged PDF created successfully")

Este código demonstra o processo de como adicionar tags ao PDF usando Python. Neste código de amostra, criamos apenas um elemento de cabeçalho e parágrafo, enquanto você pode usar create_annot_element(), create_art_element(), create_figure_element(), create_form_element() ou create_link_element() da longa lista de métodos disponíveis para criar o respectivo conforme mencionado nos nomes dos métodos.

Este tutorial nos ensinou como adicionar tags a arquivos PDF usando Python. Se você quiser aprender o processo de recortar páginas PDF, consulte o artigo em como recortar páginas PDF usando Python.

 Português