In deze korte tutorial leren we hoe je Word Document converteert naar HTML met Python. De voorbeeldregels code in Python converteren DOCX efficiënt naar HTML door de eenvoudige stappen te volgen. Men kan deze conversie uitvoeren op elk besturingssysteem zoals Linux, macOS of MS Windows waar het .NET-framework is geconfigureerd.
Stappen om Word-document naar HTML te converteren met Python
- Stel de omgeving in voor het gebruik van Aspose.Words voor Python via .NET in uw toepassing
- Voeg naamruimten en klassen toe die vereist zijn aan het begin van het programma
- Open het bron-Word-bestand van de schijf in het klasseobject Document voor conversie naar HTML
- Initialiseer het HtmlSaveOptions-object om de HTML-uitvoer aan te passen
- Converteer de DOCX naar HTML met behulp van de opslagmethode
Met behulp van de bovenstaande stappen in Python DOCX naar HTML wordt conversie bereikt. Allereerst wordt de instantie van de documentklasse gebruikt voor het laden van het invoer-Word-document en vervolgens voor het instellen van verschillende eigenschappen voor het HTML-weergaveproces, zoals ExportPageMargins, CssStyleSheetType en ImageResolution, enz. Ten slotte wordt het uitvoerbestand op de schijf opgeslagen met de HTML-bestandsextensie .
Code om Word naar HTML te converteren in Python
In Python Word naar HTML is een conversietoepassing ontwikkeld met behulp van het bovengenoemde voorbeeld. De instantie van de klasse Document wordt gebruikt voor het laden van het bron-Word-document en vervolgens worden verschillende weergave-opties gespecificeerd om de eigenschappen van het HTML-uitvoerbestand aan te passen. Ten slotte wordt voor het opslaan van de Word naar HTML Python-gebaseerde opslagmethode gebruikt.
In dit artikel hebben we het proces onderzocht om DOCX naar HTML te converteren met behulp van een op Python gebaseerde API. Als u echter een DOCX-bestand naar PDF wilt converteren, raadpleeg dan het artikel op hoe Word naar PDF te converteren met Python.