Tento krátký tutoriál vás seznámí s tím, jak upravit PDF dokument v Pythonu. Obsahuje podrobnosti pro nastavení vývojového prostředí pro změnu PDF, seznam kroků k provádění různých operací s PDF a spustitelný ukázkový kód pro vývoj základního PDF editoru v Pythonu. Představuje různé třídy a metody pro úpravu souboru PDF.
Kroky k úpravě dokumentu PDF v Pythonu
- Chcete-li upravit soubor PDF, nastavte vývojové prostředí na použijte Aspose.PDF pro Python přes .NET
- Vytvořte objekt třídy PdfContentEditor a svažte s ním cílový soubor Pdf
- Nahraďte část textu v celém souboru
- Nahraďte nějaký jiný text a změňte jeho barvu a velikost písma
- Přidejte nějaký text do existujícího souboru PDF pomocí objektu třídy PdfFileMend
- Vytvořte instanci nové stránky a přidejte na ni nějaký text pomocí třídy Document
- Uložte výstupní soubor PDF
Výše uvedené kroky definují proces úpravy dokumentu PDF v Pythonu. Proces zahájíme vytvořením objektu třídy PdfContentEditor, následovaným svázáním cílového souboru PDF s ním, aby se nahradil text v celém souboru a beze změny barvy textu a písma. Dále jsme použili objekt třídy PdfFileMend k přidání textu na existující stránku a nakonec jsme před uložením výstupního souboru PDF vložili novou stránku s ukázkovým textem.
Kód pro úpravu souboru PDF v Pythonu
import aspose.pdf as pdf | |
# Load License | |
license = pdf.License() | |
license.set_license("License.lic") | |
# Create PdfFileEditor object | |
editor = pdf.facades.PdfContentEditor() | |
editor.bind_pdf("input.pdf") | |
# Replace some text in the entire file | |
while True: | |
if editor.replace_text("scenario","situation") == False: | |
break | |
# Replace some text and change its font and color | |
textState = pdf.text.TextState() | |
textState.foreground_color = pdf.Color.red | |
textState.font_size = 14 | |
while True: | |
if editor.replace_text("attack","fight",textState) == False: | |
break | |
editor.save("intermediate.pdf") | |
# Add text to an existing page | |
mendor = pdf.facades.PdfFileMend() | |
mendor.bind_pdf("intermediate.pdf") | |
message = pdf.facades.FormattedText("Test message on the page") | |
mendor.add_text(message, 2,60,300) | |
mendor.save("intermediate.pdf") | |
# Add a paragraph with some text on a new page | |
document = pdf.Document("intermediate.pdf") | |
page = document.pages.add() | |
page.paragraphs.add(pdf.text.TextFragment("New paragraph is added")) | |
# Save the output | |
document.save("output.pdf") | |
print("PDF file edited successfully") |
Tento kód demonstruje úkol vývoje PDF modifikátoru v Pythonu. V této úloze je ukázkový soubor PDF načten a uložen jako přechodný soubor po nahrazení některého textu v něm a poté znovu načten přechodný soubor pro použití objektem PdfFileMend a třídou Document. Pro práci se soubory PDF máte k dispozici několik tříd, včetně PdfAnnotationEditor, PdfBookmarkEditor, PdfConverter a PdfExtractor, abychom jmenovali alespoň některé.
Tento krátký průvodce nás naučil vytvářet PDF editor software v Pythonu. Pokud se chcete naučit proces vkládání tabulky, přečtěte si článek na jak vložit tabulku do PDF pomocí Pythonu.