Tento přehledný tutoriál poskytuje podrobnosti o jak převést PDF do Wordu pomocí Pythonu tím, že poskytuje odkaz na konfiguraci prostředí pro práci s Aspose.Words v Pythonu. Obsahuje také pokyny k použití nezbytných tříd a jmenných prostorů v kódu. Chcete-li převést PDF do DOCX Python, je na konci sdílen kód, který lze použít k transformaci jakéhokoli souboru PDF na soubor aplikace Word, jako je DOC, DOCX atd.
Kroky k transformaci PDF do Wordu v Pythonu
- Vytvořte prostředí pro použití Aspose.Words pro Python přes .NET ve vaší aplikaci
- Importujte požadované jmenné prostory a třídy na začátku programu
- Načtěte vstupní soubor PDF do objektu třídy Document pro převod do Wordu
- Uložte dokument jako soubor DOCX na disk
Při používání Python PDF do Wordu lze pomocí výše uvedených kroků vyvinout konvertor. V prvním kroku je poskytnut odkaz pro vytvoření prostředí a instalací, které jsou nutné ke spuštění tohoto kódu. V dalších krocích je navržen import tříd a jmenných prostorů a nakonec načtete soubor PDF a převedete jej na soubor DOCX.
Kód pro změnu PDF na Word pomocí Pythonu
from distutils.command.build import build | |
import aspose.words as aw | |
# Initialize the license to avoid trial version watermark in the output word file | |
converterAppLicense = aw.License() | |
converterAppLicense.set_license("Aspose.Word.lic") | |
# Load the source PDF using the document class object | |
doc = aw.Document("input.pdf") | |
# Save the output word file as DOCX | |
doc.save("out.docx") |
Jak převést PDF do kódu Word Python je ukázáno výše, které používá třídu Document k načtení zdrojového souboru PDF. PdfLoadOptions můžete použít k nastavení různých typů filtrů a dalších parametrů, jako je page_index, odkud se mají stránky načítat, a page_count k nastavení počtu stránek, které se mají načíst od page_index. Můžete také nastavit heslo pro načtení chráněného souboru PDF.
Tento článek nás naučil generovat soubor Word ze souboru PDF. Pokud se chcete naučit proces vytváření souboru Word v Pythonu, přečtěte si článek na jak vytvořit dokument Word pomocí Pythonu.