Ten krótki samouczek został napisany w celu zbadania jak podzielić strony w programie Word przy użyciu języka Python za pomocą szczegółowych instrukcji i przykładowego kodu, który można uruchomić. Wszystkie niezbędne klasy i metody są wprowadzane i używane w uruchamialnym kodzie przykładowym w celu wyjaśnienia procesu. Możesz podzielić dokument Worda za pomocą Pythona na różne sposoby, na przykład na strony, jak pokazano w tym samouczku, a następnie zapisać każdą stronę jako osobny plik DOCX lub DOC zgodnie z wymaganiami.
Kroki, aby podzielić plik Word za pomocą Pythona
- Skonfiguruj swoje IDE do korzystania z Aspose.Words dla Pythona przez .NET
- Załaduj plik źródłowy programu Word do obiektu klasy Document w celu podziału na strony
- Uzyskaj liczbę załadowanych stron plików
- Wylicz każdą stronę do extract jako osobny dokument
- Zapisz każdą wyodrębnioną stronę jako osobny dokument Word
Te kroki prowadzą do podzielenia dokumentu programu Word na osobne pliki przy użyciu języka Python, udostępniając logikę programowania i zasoby wymagane do uwzględnienia w projekcie. Najpierw możesz załadować źródłowy plik programu Word do obiektu klasy Document, który zawiera różne właściwości, takie jak użyte tutaj page_count i metody wyodrębniania jednej lub więcej stron zgodnie z wymaganiami. W ostatnim kroku wszystkie strony dokumentu są przeglądane jedna po drugiej i zapisywane w obsługiwanym formacie pliku.
Kod do Split DOCX za pomocą Pythona
import aspose.words as aw | |
# Load the license | |
wordToHtml = aw.License() | |
wordToHtml.set_license("Aspose.Total.lic") | |
# Load the file | |
docSource = aw.Document("LargeFile.docx") | |
# Get page count | |
pageCount = docSource.page_count | |
# Parse through all pages | |
for page in range(pageCount): | |
# Extract current page | |
desiredPages = docSource.extract_pages(page, 1) | |
# Save current page | |
desiredPages.save("Page-" + str(page + 1) + ".docx") | |
print ("Word file pages split successfully") |
Aby wyodrębnić strony z dokumentu Word za pomocą Pythona, używany jest obiekt klasy Document, który zawiera szereg przeciążonych konstruktorów, które obsługują ładowanie pliku Word z dysku lub strumienia, umożliwiają ustawienie wywołania zwrotnego ostrzeżenia w celu obsługi błędów, ustawienie wywołania zwrotnego postępu w celu monitorowania, zapewnienie hasło do chronionych plików i właściwości kodowania, aby wymienić tylko kilka. Możesz wyodrębniać strony pojedynczo lub w grupach, zaczynając od określonej strony.
Ten samouczek poprowadził nas do * podzielenia pliku Worda na wiele plików za pomocą Pythona *. Jeśli chcesz poznać proces tworzenia pliku Word od podstaw, zapoznaj się z artykułem na jak stworzyć dokument Word za pomocą Pythona.