I den här korta handledningen kommer vi att lära oss hur man konverterar Word Document till HTML med Python. Exempel på kodrader i Python konverterar DOCX till HTML effektivt genom att följa de enkla stegen. Man kan utföra denna konvertering på vilket operativsystem som helst som Linux, macOS eller MS Windows där .NET-ramverket är konfigurerat.
Steg för att konvertera Word-dokument till HTML med Python
- Ställ in miljön för att använda Aspose.Words för Python via .NET i din applikation
- Inkludera namnutrymmen och klasser som krävs i början av programmet
- Öppna Word-källfilen från disken till dokumentklassobjektet för konvertering till HTML
- Initiera HtmlSaveOptions-objektet för att anpassa utdata-HTML
- Konvertera DOCX till HTML med hjälp av sparmetoden
Med hjälp av ovanstående steg i Python DOCX till HTML uppnås konvertering. Först och främst används instansen Document-klassen för att ladda det inmatade Word-dokumentet och sedan ställa in olika egenskaper för HTML-renderingsprocessen som ExportPageMargins, CssStyleSheetType och ImageResolution, etc. Slutligen sparas utdatafilen på disken med HTML-filtillägget .
Kod för att konvertera Word till HTML i Python
I Python Word to HTML är konverteringsapplikationen utvecklad med hjälp av det tidigare nämnda exemplet. Förekomsten av klassen Document används för att ladda Word-källdokumentet och sedan specificeras olika renderingsalternativ för att anpassa egenskaperna för HTML-utdatafilen. Slutligen, för att spara den Word to HTML Python-baserade sparmetoden används.
I den här artikeln har vi utforskat processen för att konvertera DOCX till HTML med Python-baserat API. Men om du vill konvertera en DOCX-fil till PDF, se artikeln om hur man konverterar Word till PDF med Python.