Como converter documento do Word para HTML usando Java

Neste tópico simples, você aprenderá como converter Word Document para HTML usando Java. As etapas simples a seguir podem ser usadas para exportar DOCX para HTML em Java em qualquer sistema operacional comum, como MS Windows, Ubuntu ou macOS, usando chamadas de API simples.

Etapas para converter documento do Word em HTML usando Java

  1. Adicionar referência de arquivo JAR Aspose.Words usando o repositório Maven
  2. Instancie o objeto Document Class para carregar o documento de origem
  3. Especifique diferentes HtmlSaveOptions, incluindo Page Margins, CssStyleSheet e Page Setup etc.
  4. Exporte DOCX para HTML em Java usando o método save

No código de exemplo a seguir, primeiro carregaremos o DOCX de origem usando a instância Document class. Em seguida, usando a instância HtmlSaveOptions class, definiremos o CssStyleSheetType, ExportPageMargins e ImageResolution. Finalmente, usando o método save vamos gerar HTML a partir do DOCX em Java.

Código para exportar DOCX para HTML em Java

Neste código de exemplo, carregamos o DOCX de origem usando uma instância da classe Documento. A instância HtmlSaveOptions class pode ser usada para definir diferentes opções como codificação, opções SVG, versão e muitas outras propriedades. Finalmente, exportamos DOCX para HTML usando Java.

No tópico anterior de como converter DOCX para TIFF usando Java, nos concentramos em renderizar DOCX para TIFF. Considerando que, neste tópico, aprendemos como gerar HTML a partir do DOCX usando Java.

 Português