Neste breve tutorial, aprenderemos como converter Word Document para HTML usando C#. Podemos exportar DOCX para HTML em C# com eficiência com as seguintes etapas simples e trecho de código. Você pode realizar essa conversão em qualquer sistema operacional como macOS, Linux ou MS Windows em que o .NET framework esteja configurado.
Etapas para converter documento do Word em HTML usando C#
- Instale a biblioteca Aspose.Words do plug-in do gerenciador de pacotes NuGet
- Instancie um objeto da classe Document para carregar o DOCX
- Especifique diferentes propriedades relacionadas a CssStyleSheet, Page Margins, Page Setup, etc.
- Salve o arquivo de saída como arquivo HTML
Nas etapas acima, primeiro a instância Document class é instanciada para carregar o documento do Word de entrada e, em seguida, define diferentes propriedades para o processo de renderização, como Margens da página, Configuração da página, etc. para personalizar as propriedades do arquivo HTML de saída. No final, o arquivo de saída é salvo com extensão de arquivo HTML.
Código para exportar DOCX para HTML em C#
using System; | |
using Aspose.Words; | |
using Aspose.Words.Saving; | |
namespace ConvertDOCXtoHTMLinCsharp | |
{ | |
class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Use Aspose.Words license to remove trial version limitations after converting Word DOCX to HTML | |
License licenseForConvertingDOCXtoHTML = new License(); | |
licenseForConvertingDOCXtoHTML.SetLicense("Aspose.Words.lic"); | |
// Load input Word DOCX file with Document class | |
Document doc = new Document("Input.docx"); | |
// Set different properties of HtmlSaveOptions class | |
HtmlSaveOptions saveOptions = new HtmlSaveOptions(); | |
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline; | |
saveOptions.ExportPageMargins = true; | |
saveOptions.ImageResolution = 90; | |
// Save output HTML | |
doc.Save("HtmlSaveOptions.html", saveOptions); | |
} | |
} | |
} |
Neste código de exemplo, uma instância de Document class é declarada para carregar o documento do Word de entrada. Diferentes opções de renderização são então especificadas para controlar as propriedades do arquivo HTML de saída. Você pode manipular como as fontes e imagens são renderizadas, ou a folha de estilo CSS e as preferências de pastas para converter os arquivos de acordo com seus requisitos. Finalmente, vamos gerar HTML a partir do DOCX usando C#.
Neste artigo, exploramos como gerar HTML de DOCX usando C#. No entanto, se você deseja converter um arquivo DOCX para TIFF, consulte o artigo em como converter DOCX para TIFF usando C#.