Jak przekonwertować dokument HTML na Word w Pythonie

Ten krótki samouczek opisuje jak przekonwertować dokument HTML na Word w Pythonie. Zawiera szczegółowe informacje dotyczące ustawiania IDE do testowania przykładowego kodu, listę kroków potrzebnych do napisania aplikacji oraz możliwy do uruchomienia przykładowy kod do konwersji HTML na DOCX w Pythonie. Opisany zostanie także przykładowy kod umożliwiający opcjonalną modyfikację załadowanego pliku HTML przed zapisaniem go jako pliku Word.

Kroki, aby przekonwertować HTML na dokument Word w Pythonie

  1. Utwórz środowisko dla użyj Aspose.Words dla Pythona poprzez .NET, aby przekonwertować HTML na DOCX
  2. Otwórz źródłowy plik HTML, korzystając z obiektu klasy Document z przestrzeni nazw aspose.words
  3. Dołącz przykładowy tekst do pierwszego akapitu pliku HTML, aby zademonstrować modyfikację HTML
  4. Save załadowany plik HTML jako plik Word, ustawiając nazwę i format

Powyższe kroki definiują proces konwersji HTML na Word DOC w Pythonie. Docelowy plik HTML jest ładowany do obiektu klasy Document z przestrzeni nazw aspose.words. Dokument ten zapisywany jest w postaci pliku Word przy pomocy metody Document.save() wraz z opcjonalną modyfikacją pliku HTML polegającą na dodaniu przykładowego tekstu na końcu pierwszego akapitu.

Kod do konwersji dokumentu HTML na Word w Pythonie

import aspose.words as aw
import aspose.pydrawing as drawing
# Load the license
wordLic = aw.License()
wordLic.set_license("License.lic")
# Load the HTML
htmlDoc = aw.Document("Sample.html")
# Append some text
htmlDoc.first_section.body.first_paragraph.append_child(aw.Run(htmlDoc, "This text is added for demonstration"))
# Save the loaded HTML document as DOCX
htmlDoc.save("output.docx", aw.SaveFormat.DOCX)
print ("HTML to Word file converted successfully")

Ten przykładowy kod to prosty konwerter dokumentów HTML na Word w Pythonie. Po załadowaniu źródłowego pliku HTML do obiektu klasy Dokument można wykorzystać wszystkie bogate funkcje do pracy z załadowanym dokumentem, na przykład dodając tekst na początku pierwszego akapitu, jak pokazano w tym przykładowym kodzie, dodając nowe węzły, tabele, wykresy itp. zgodnie z wymaganiami. Podobnie plik wyjściowy można zapisać w formacie DOCX, DOC, DOCM, RTF, XPS, SVG, TIFF, PNG, JPEG, GIF i EPS, aby wymienić tylko kilka.

W tym artykule nauczyliśmy się transformacji HTML na Word w Pythonie. Jeżeli chcesz poznać proces konwersji pliku HTML do formatu PDF zapoznaj się z artykułem na stronie jak przekonwertować HTML na PDF w Pythonie.

 Polski