U ovom kratkom vodiču naučit ćemo kako pretvoriti Word Document u HTML pomoću Pythona. Ogledni redovi koda u Python pretvaraju DOCX u HTML učinkovito slijedeći jednostavne korake. Ovu konverziju možete izvesti na bilo kojem operativnom sustavu kao što su Linux, macOS ili MS Windows gdje je konfiguriran .NET framework.
Koraci za pretvaranje Word dokumenta u HTML pomoću Pythona
- Postavite okruženje za korištenje Aspose.Words za Python putem .NET-a u vašoj aplikaciji
- Uključite prostore imena i klase koji su potrebni na početku programa
- Otvorite izvornu Word datoteku s diska u objektu klase dokumenta za konverziju u HTML
- Inicijalizirajte objekt HtmlSaveOptions da biste prilagodili izlazni HTML
- Pretvorite DOCX u HTML pomoću metode spremanja
Uz pomoć gornjih koraka u Python DOCX u HTML postiže se konverzija. Prije svega, instanca klase Document koristi se za učitavanje ulaznog Word dokumenta, a zatim postavljanje različitih svojstava za proces HTML renderiranja kao što su ExportPageMargins, CssStyleSheetType i ImageResolution, itd. Na kraju, izlazna datoteka sprema se na disk s ekstenzijom HTML datoteke .
Kod za pretvaranje Worda u HTML u Pythonu
U Python Word u HTML aplikacija za pretvorbu razvijena je uz pomoć gore navedenog primjera. Instanca klase Document koristi se za učitavanje izvornog Word dokumenta, a zatim se određuju različite opcije iscrtavanja za prilagodbu svojstava izlazne HTML datoteke. Konačno, za spremanje se koristi Word to HTML Python metoda spremanja.
U ovom smo članku istražili postupak konvertiranja DOCX u HTML pomoću API-ja temeljenog na Python. Međutim, ako želite pretvoriti DOCX datoteku u PDF, pogledajte članak na kako pretvoriti Word u PDF pomoću Pythona.