W tym krótkim samouczku nauczymy się konwertować Word Document na HTML za pomocą Pythona. Przykładowe wiersze kodu w Pythonie skutecznie konwertują DOCX na HTML, wykonując proste kroki. Konwersję tę można wykonać na dowolnym systemie operacyjnym, takim jak Linux, macOS lub MS Windows, w którym skonfigurowany jest framework .NET.
Kroki, aby przekonwertować dokument programu Word na format HTML za pomocą Pythona
- Skonfiguruj środowisko do używania Aspose.Words dla Pythona przez .NET w swojej aplikacji
- Dołącz przestrzenie nazw i klasy, które są wymagane na początku programu
- Otwórz źródłowy plik programu Word z dysku do obiektu klasy Dokument w celu konwersji do formatu HTML
- Zainicjuj obiekt HtmlSaveOptions, aby dostosować wyjściowy kod HTML
- Konwertuj DOCX na HTML za pomocą metody zapisu
Za pomocą powyższych kroków w Python DOCX do HTML uzyskuje się konwersję. Przede wszystkim instancja klasy Document służy do ładowania wejściowego dokumentu programu Word, a następnie ustawiania różnych właściwości procesu renderowania HTML, takich jak ExportPageMargins, CssStyleSheetType i ImageResolution itp. Ostatecznie plik wyjściowy jest zapisywany na dysku z rozszerzeniem pliku HTML .
Kod do konwersji Worda na HTML w Pythonie
W Pythonie aplikacja do konwersji Word to HTML jest rozwijana za pomocą powyższego przykładu. Instancja klasy Document służy do ładowania źródłowego dokumentu programu Word, a następnie określane są różne opcje renderowania w celu dostosowania właściwości wyjściowego pliku HTML. Na koniec do zapisania używana jest metoda zapisu oparta na Word to HTML Python.
W tym artykule zbadaliśmy proces konwersji DOCX na HTML przy użyciu API opartego na Pythonie. Jeśli jednak chcesz przekonwertować plik DOCX na format PDF, zapoznaj się z artykułem na temat jak przekonwertować Worda na PDF za pomocą Pythona.