I den här korta handledningen kommer vi att lära oss hur man konverterar Word Document till HTML med C#. Vi kan effektivt exportera DOCX till HTML i C# med följande enkla steg och kodavsnitt. Du kan utföra denna konvertering på vilket operativsystem som helst som macOS, Linux eller MS Windows där .NET Framework är konfigurerat.
Steg för att konvertera Word-dokument till HTML med C#
- Installera Aspose.Words-biblioteket från NuGet-pakethanterarens plugin
- Instantiera ett objekt av klassen Document för att ladda DOCX
- Ange olika egenskaper relaterade till CssStyleSheet, Page Margins, Page Setup, etc.
- Spara utdatafilen som HTML-fil
I stegen ovan instansieras först Document class-instansen för att ladda det inmatade Word-dokumentet och ställer sedan in olika egenskaper för renderingsprocessen som sidmarginaler, sidinställningar, etc. för att anpassa egenskaperna för utdata-HTML-filen. I slutändan sparas utdatafilen med HTML-filtillägget.
Kod för att exportera DOCX till HTML i C#
I denna exempelkod deklareras en instans av Document class för inläsning av Word-dokumentet. Olika renderingsalternativ specificeras sedan för att kontrollera egenskaperna för utdata-HTML-filen. Du kan manipulera hur teckensnitten och bilderna renderas, eller inställningarna för css-stilmall och mappar för att konvertera filerna enligt dina krav. Slutligen kommer vi generera HTML från DOCX med C#.
I den här artikeln har vi utforskat hur man genererar HTML från DOCX med C#. Men om du vill konvertera en DOCX-fil till TIFF, se artikeln om hur man konverterar DOCX till TIFF med C#.