Como editar um documento PDF em Python

Este breve tutorial orienta sobre como editar o documento PDF em Python. Ele contém os detalhes para definir o ambiente de desenvolvimento para alterar o PDF, uma lista de etapas para realizar diferentes operações no PDF e um código de exemplo executável para desenvolver um editor de PDF básico em Python. Ele apresenta várias classes e métodos para modificar o arquivo PDF.

Etapas para editar um documento PDF em Python

  1. Defina o ambiente de desenvolvimento como use Aspose.PDF para Python via .NET para editar um arquivo PDF
  2. Crie um objeto de classe PdfContentEditor e vincule o arquivo PDF de destino a ele
  3. Substitua algum texto em todo o arquivo
  4. Substitua algum outro texto e altere sua cor e tamanho da fonte
  5. Adicione algum texto ao arquivo PDF existente usando o objeto de classe PdfFileMend
  6. Instancie uma nova página e adicione algum texto a ela usando a classe Document
  7. Salve o arquivo PDF de saída

As etapas acima definem o processo para editar documentos PDF em Python. Iniciamos o processo criando um objeto da classe PdfContentEditor, seguido da vinculação do arquivo PDF de destino a ele para substituir o texto em todo o arquivo com e sem alterar a cor e a fonte do texto. Em seguida, usamos o objeto da classe PdfFileMend para adicionar texto em uma página existente e finalmente inserimos uma nova página com algum texto de amostra antes de salvar o arquivo PDF de saída.

Código para modificar arquivo PDF em Python

import aspose.pdf as pdf
# Load License
license = pdf.License()
license.set_license("License.lic")
# Create PdfFileEditor object
editor = pdf.facades.PdfContentEditor()
editor.bind_pdf("input.pdf")
# Replace some text in the entire file
while True:
if editor.replace_text("scenario","situation") == False:
break
# Replace some text and change its font and color
textState = pdf.text.TextState()
textState.foreground_color = pdf.Color.red
textState.font_size = 14
while True:
if editor.replace_text("attack","fight",textState) == False:
break
editor.save("intermediate.pdf")
# Add text to an existing page
mendor = pdf.facades.PdfFileMend()
mendor.bind_pdf("intermediate.pdf")
message = pdf.facades.FormattedText("Test message on the page")
mendor.add_text(message, 2,60,300)
mendor.save("intermediate.pdf")
# Add a paragraph with some text on a new page
document = pdf.Document("intermediate.pdf")
page = document.pages.add()
page.paragraphs.add(pdf.text.TextFragment("New paragraph is added"))
# Save the output
document.save("output.pdf")
print("PDF file edited successfully")

Este código demonstra a tarefa de desenvolver um modificador PDF em Python. Nesta tarefa, o arquivo PDF de amostra é carregado e salvo como um arquivo intermediário após a substituição de algum texto nele, seguido pelo carregamento do arquivo intermediário novamente para uso pelo objeto PdfFileMend e pela classe Document, respectivamente. Existem várias classes à sua disposição para lidar com arquivos PDF, incluindo PdfAnnotationEditor, PdfBookmarkEditor, PdfConverter e PdfExtractor, para citar alguns.

Este breve guia nos ensinou a criar software editor de PDF em Python. Se você quiser aprender o processo de inserção de uma tabela, consulte o artigo em como inserir tabela em PDF usando Python.

 Português