Как редактировать PDF-документ в Python

В этом кратком руководстве рассказывается, как редактировать документ PDF в Python. Он содержит подробную информацию о настройке среды разработки для изменения PDF-файла, список шагов для выполнения различных операций с PDF-файлом и работоспособный пример кода для разработки базового редактора PDF на Python. Он представляет различные классы и методы для изменения PDF-файла.

Действия по редактированию PDF-документа в Python

  1. Установите среду разработки используйте Aspose.PDF для Python через .NET, чтобы редактировать PDF-файл.
  2. Создайте объект класса PdfContentEditor и свяжите с ним целевой PDF-файл.
  3. Заменить часть текста во всем файле
  4. Замените другой текст и измените его цвет и размер шрифта.
  5. Добавьте текст в существующий PDF-файл, используя объект класса PdfFileMend.
  6. Создайте экземпляр новой страницы и добавьте к ней текст, используя класс Document.
  7. Сохраните выходной PDF-файл

Вышеуказанные шаги определяют процесс редактирования PDF-документа в Python. Мы инициируем процесс, создавая объект класса PdfContentEditor с последующей привязкой к нему целевого PDF-файла для замены текста во всем файле с изменением цвета и шрифта текста и без него. Затем мы использовали объект класса PdfFileMend для добавления текста на существующую страницу и, наконец, вставили новую страницу с образцом текста перед сохранением выходного PDF-файла.

Код для изменения PDF-файла в Python

import aspose.pdf as pdf
# Load License
license = pdf.License()
license.set_license("License.lic")
# Create PdfFileEditor object
editor = pdf.facades.PdfContentEditor()
editor.bind_pdf("input.pdf")
# Replace some text in the entire file
while True:
if editor.replace_text("scenario","situation") == False:
break
# Replace some text and change its font and color
textState = pdf.text.TextState()
textState.foreground_color = pdf.Color.red
textState.font_size = 14
while True:
if editor.replace_text("attack","fight",textState) == False:
break
editor.save("intermediate.pdf")
# Add text to an existing page
mendor = pdf.facades.PdfFileMend()
mendor.bind_pdf("intermediate.pdf")
message = pdf.facades.FormattedText("Test message on the page")
mendor.add_text(message, 2,60,300)
mendor.save("intermediate.pdf")
# Add a paragraph with some text on a new page
document = pdf.Document("intermediate.pdf")
page = document.pages.add()
page.paragraphs.add(pdf.text.TextFragment("New paragraph is added"))
# Save the output
document.save("output.pdf")
print("PDF file edited successfully")

Этот код демонстрирует задачу разработки модификатора PDF на Python. В этой задаче образец PDF-файла загружается и сохраняется как промежуточный файл после замены в нем некоторого текста с последующей загрузкой промежуточного файла еще раз для использования объектом PdfFileMend и классом Document соответственно. В вашем распоряжении несколько классов для обработки PDF-файлов, включая PdfAnnotationEditor, PdfBookmarkEditor, PdfConverter и PdfExtractor, и это лишь некоторые из них.

Это краткое руководство научило нас создавать программное обеспечение для редактирования PDF-файлов на Python. Если вы хотите узнать, как вставить таблицу, обратитесь к статье как вставить таблицу в PDF с помощью Python.

 Русский