Comment convertir un document Word en HTML en utilisant Java

Dans cette rubrique simple, vous apprendrez comment convertir Word Document en HTML en utilisant Java. Les étapes simples suivantes peuvent être utilisées pour exporter DOCX vers HTML en Java dans n’importe quel système d’exploitation courant comme MS Windows, Ubuntu ou macOS à l’aide d’appels API simples.

Étapes pour convertir un document Word en HTML à l’aide de Java

  1. Ajouter Aspose.Words référence de fichier JAR à l’aide du référentiel Maven
  2. Instanciez l’objet Document Class pour charger le document source
  3. Spécifiez différentes HtmlSaveOptions, y compris les marges de page, CssStyleSheet et la mise en page, etc.
  4. Exporter DOCX vers HTML en Java en utilisant la méthode de sauvegarde

Dans l’exemple de code suivant, nous allons d’abord charger le DOCX source à l’aide de l’instance Document class. Ensuite, en utilisant l’instance HtmlSaveOptions class, nous définirons CssStyleSheetType, ExportPageMargins et ImageResolution. Enfin, en utilisant la méthode de sauvegarde, nous allons générer du HTML à partir de DOCX en Java.

Code pour exporter DOCX vers HTML en Java

Dans cet exemple de code, nous avons chargé le DOCX source à l’aide d’une instance de Document class. L’instance HtmlSaveOptions class peut être utilisée pour définir différentes options telles que l’encodage, les options SVG, la version et de nombreuses autres propriétés. Enfin, nous exportons DOCX vers HTML en utilisant Java.

Dans le sujet précédent de comment convertir DOCX en TIFF en utilisant Java, nous nous sommes concentrés sur le rendu DOCX en TIFF. Alors que, dans cette rubrique, nous avons appris à générer du HTML à partir de DOCX en utilisant Java.

 Français