Cómo convertir un documento de Word a HTML usando Java

En este tema simple, aprenderá cómo convertir Word Document a HTML usando Java. Los siguientes pasos simples se pueden usar para exportar DOCX a HTML en Java en cualquier sistema operativo común como MS Windows, Ubuntu o macOS usando llamadas API simples.

Pasos para convertir documentos de Word a HTML usando Java

  1. Agregue Aspose.Words referencia de archivo JAR usando el repositorio de Maven
  2. Crear una instancia del objeto Document Class para cargar el documento de origen
  3. Especifique diferentes HtmlSaveOptions, incluidos los márgenes de página, CssStyleSheet y configuración de página, etc.
  4. Exporte DOCX a HTML en Java usando el método de guardar

En el siguiente código de ejemplo, primero cargaremos el DOCX de origen usando la instancia Document class. Luego, usando la instancia HtmlSaveOptions class, configuraremos CssStyleSheetType, ExportPageMargins e ImageResolution. Finalmente, usando el método de guardar, generaremos HTML desde DOCX en Java.

Código para exportar DOCX a HTML en Java

En este código de muestra, hemos cargado el DOCX de origen usando una instancia de Document class. La instancia HtmlSaveOptions class se puede usar para configurar diferentes opciones como codificación, opciones de SVG, versión y muchas otras propiedades. Finalmente, exportamos DOCX a HTML usando Java.

En el tema anterior de cómo convertir DOCX a TIFF usando Java, nos enfocamos en renderizar DOCX a TIFF. Mientras que, en este tema, hemos aprendido cómo generar HTML desde DOCX usando Java.

 Español