Cómo convertir un documento de Word a HTML usando Java

En este tema simple, aprenderá cómo convertir Word Document a HTML usando Java. Los siguientes pasos simples se pueden usar para exportar DOCX a HTML en Java en cualquier sistema operativo común como MS Windows, Ubuntu o macOS usando llamadas API simples.

Pasos para convertir documentos de Word a HTML usando Java

  1. Agregue Aspose.Words referencia de archivo JAR usando el repositorio de Maven
  2. Crear una instancia del objeto Document Class para cargar el documento de origen
  3. Especifique diferentes HtmlSaveOptions, incluidos los márgenes de página, CssStyleSheet y configuración de página, etc.
  4. Exporte DOCX a HTML en Java usando el método de guardar

En el siguiente código de ejemplo, primero cargaremos el DOCX de origen usando la instancia Document class. Luego, usando la instancia HtmlSaveOptions class, configuraremos CssStyleSheetType, ExportPageMargins e ImageResolution. Finalmente, usando el método de guardar, generaremos HTML desde DOCX en Java.

Código para exportar DOCX a HTML en Java

import com.aspose.words.CssStyleSheetType;
import com.aspose.words.Document;
import com.aspose.words.HtmlSaveOptions;
import com.aspose.words.ImageColorMode;
import com.aspose.words.ImageSaveOptions;
import com.aspose.words.License;
import com.aspose.words.SaveFormat;
public class WordsKB {
public static void main(String[] wordsArgs) throws Exception {
{
// Use Aspose.Words for Java license to remove trial version limitations
// after converting Word DOCX to HTML
License licenseConvertDOCXtoHTML = new License();
licenseConvertDOCXtoHTML.setLicense("Java.Aspose.Words.lic");
// Load input Word DOCX file with Document class
Document sourceDoc = new Document("Input.docx");
// Set different properties of HtmlSaveOptions class
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.INLINE);
saveOptions.setExportPageMargins(true);
saveOptions.setImageResolution(90);
// Export docx to HTML in Java
sourceDoc.save("SavedHtml.html", saveOptions);
}
}

En este código de muestra, hemos cargado el DOCX de origen usando una instancia de Document class. La instancia HtmlSaveOptions class se puede usar para configurar diferentes opciones como codificación, opciones de SVG, versión y muchas otras propiedades. Finalmente, exportamos DOCX a HTML usando Java.

En el tema anterior de cómo convertir DOCX a TIFF usando Java, nos enfocamos en renderizar DOCX a TIFF. Mientras que, en este tema, hemos aprendido cómo generar HTML desde DOCX usando Java.

 Español