Tento krátký tutoriál je napsán tak, aby prozkoumal jak rozdělit stránky ve Wordu pomocí Pythonu s pomocí podrobných kroků a spustitelného ukázkového kódu. Všechny potřebné třídy a metody jsou zavedeny a použity ve spustitelném ukázkovém kódu k objasnění procesu. Dokument Wordu můžete rozdělit pomocí Pythonu různými způsoby, například po stránkách, jak je ukázáno v tomto tutoriálu, a poté uložit každou stránku jako samostatný soubor DOCX nebo DOC podle vašich požadavků.
Kroky k rozdělení souboru Word pomocí Pythonu
- Nakonfigurujte své IDE pro použití Aspose.Words pro Python přes .NET
- Načtěte zdrojový soubor aplikace Word do objektu třídy Document pro rozdělení na stránky
- Získejte počet načtených stránek souboru
- Vyjmenujte každou stránku až do extract jako samostatný dokument
- Uložte každou extrahovanou stránku jako samostatný dokument aplikace Word
Tyto kroky vedou k rozdělení dokumentu Wordu do samostatných souborů pomocí Pythonu sdílením programovací logiky a zdrojů, které jsou nutné k zahrnutí do projektu. Nejprve můžete načíst zdrojový soubor aplikace Word do objektu třídy Document, který obsahuje různé vlastnosti, jako je zde použitý počet stránek, a metody pro extrahování jedné nebo více stránek podle požadavků. V posledním kroku jsou všechny stránky dokumentu iterovány jedna po druhé a uloženy do podporovaného formátu souboru.
Kód pro rozdělení DOCX pomocí Pythonu
import aspose.words as aw | |
# Load the license | |
wordToHtml = aw.License() | |
wordToHtml.set_license("Aspose.Total.lic") | |
# Load the file | |
docSource = aw.Document("LargeFile.docx") | |
# Get page count | |
pageCount = docSource.page_count | |
# Parse through all pages | |
for page in range(pageCount): | |
# Extract current page | |
desiredPages = docSource.extract_pages(page, 1) | |
# Save current page | |
desiredPages.save("Page-" + str(page + 1) + ".docx") | |
print ("Word file pages split successfully") |
Pro extrahování stránek z dokumentu Word pomocí Pythonu se používá objekt třídy Document, který obsahuje řadu přetížených konstruktorů, které podporují načítání souboru aplikace Word z disku nebo streamu, umožňují nastavení zpětného volání upozornění pro zpracování chyb, nastavení zpětných volání průběhu pro monitorování, poskytování heslo pro chráněné soubory a vlastnosti kódování, abychom jmenovali alespoň některé. Stránky můžete extrahovat jednu po druhé nebo ve skupinách počínaje určitou stránkou.
Tento tutoriál nás navedl k rozdělení souboru Wordu do více souborů pomocí Pythonu. Pokud se chcete naučit proces vytváření souboru Word od začátku, přečtěte si článek na jak vytvořit dokument Word pomocí Pythonu.