Ten krótki samouczek opisuje jak przekonwertować dokument HTML na Word w Pythonie. Zawiera szczegółowe informacje dotyczące ustawiania IDE do testowania przykładowego kodu, listę kroków potrzebnych do napisania aplikacji oraz możliwy do uruchomienia przykładowy kod do konwersji HTML na DOCX w Pythonie. Opisany zostanie także przykładowy kod umożliwiający opcjonalną modyfikację załadowanego pliku HTML przed zapisaniem go jako pliku Word.
Kroki, aby przekonwertować HTML na dokument Word w Pythonie
- Utwórz środowisko dla użyj Aspose.Words dla Pythona poprzez .NET, aby przekonwertować HTML na DOCX
- Otwórz źródłowy plik HTML, korzystając z obiektu klasy Document z przestrzeni nazw aspose.words
- Dołącz przykładowy tekst do pierwszego akapitu pliku HTML, aby zademonstrować modyfikację HTML
- Save załadowany plik HTML jako plik Word, ustawiając nazwę i format
Powyższe kroki definiują proces konwersji HTML na Word DOC w Pythonie. Docelowy plik HTML jest ładowany do obiektu klasy Document z przestrzeni nazw aspose.words. Dokument ten zapisywany jest w postaci pliku Word przy pomocy metody Document.save() wraz z opcjonalną modyfikacją pliku HTML polegającą na dodaniu przykładowego tekstu na końcu pierwszego akapitu.
Kod do konwersji dokumentu HTML na Word w Pythonie
import aspose.words as aw | |
import aspose.pydrawing as drawing | |
# Load the license | |
wordLic = aw.License() | |
wordLic.set_license("License.lic") | |
# Load the HTML | |
htmlDoc = aw.Document("Sample.html") | |
# Append some text | |
htmlDoc.first_section.body.first_paragraph.append_child(aw.Run(htmlDoc, "This text is added for demonstration")) | |
# Save the loaded HTML document as DOCX | |
htmlDoc.save("output.docx", aw.SaveFormat.DOCX) | |
print ("HTML to Word file converted successfully") |
Ten przykładowy kod to prosty konwerter dokumentów HTML na Word w Pythonie. Po załadowaniu źródłowego pliku HTML do obiektu klasy Dokument można wykorzystać wszystkie bogate funkcje do pracy z załadowanym dokumentem, na przykład dodając tekst na początku pierwszego akapitu, jak pokazano w tym przykładowym kodzie, dodając nowe węzły, tabele, wykresy itp. zgodnie z wymaganiami. Podobnie plik wyjściowy można zapisać w formacie DOCX, DOC, DOCM, RTF, XPS, SVG, TIFF, PNG, JPEG, GIF i EPS, aby wymienić tylko kilka.
W tym artykule nauczyliśmy się transformacji HTML na Word w Pythonie. Jeżeli chcesz poznać proces konwersji pliku HTML do formatu PDF zapoznaj się z artykułem na stronie jak przekonwertować HTML na PDF w Pythonie.