Cómo convertir un documento de Word a HTML usando C#

En este breve tutorial, aprenderemos cómo convertir Word Document a HTML usando C#. Podemos exportar DOCX a HTML en C# de manera eficiente con los siguientes pasos simples y un fragmento de código. Puede realizar esta conversión en cualquier sistema operativo como macOS, Linux o MS Windows donde esté configurado .NET framework.

Pasos para convertir un documento de Word a HTML usando C#

  1. Instale la biblioteca Aspose.Words desde el complemento del administrador de paquetes NuGet
  2. Crea una instancia de un objeto de la clase Document para cargar DOCX
  3. Especifique diferentes propiedades relacionadas con CssStyleSheet, márgenes de página, configuración de página, etc.
  4. Guarde el archivo de salida como archivo HTML

En los pasos anteriores, en primer lugar, se crea una instancia de la clase de documento para cargar el documento de Word de entrada y luego se establecen diferentes propiedades para el proceso de representación, como márgenes de página, configuración de página, etc., para personalizar las propiedades del archivo HTML de salida. Al final, el archivo de salida se guarda con la extensión de archivo HTML.

Código para exportar DOCX a HTML en C#

En este código de ejemplo, se declara una instancia de clase de documento para cargar el documento de Word de entrada. A continuación, se especifican diferentes opciones de representación para controlar las propiedades del archivo HTML de salida. Puede manipular cómo se representan las fuentes y las imágenes, o la hoja de estilo css y las preferencias de carpetas para convertir los archivos según sus requisitos. Finalmente, generaremos HTML desde DOCX usando C#.

En este artículo, hemos explorado cómo generar HTML desde DOCX usando C#. Sin embargo, si desea convertir un archivo DOCX a TIFF, consulte el artículo sobre cómo convertir DOCX a TIFF usando C#.

 Español