Как преобразовать документ Word в HTML с помощью Java

В этом простом разделе вы узнаете, как преобразовать Word Document в HTML с помощью Java. Следующие простые шаги можно использовать для экспорта DOCX в HTML на Java в любой распространенной операционной системе, такой как MS Windows, Ubuntu или macOS, с помощью простых вызовов API.

Шаги для преобразования документа Word в HTML с использованием Java

  1. Добавьте ссылку на Aspose.Words файл JAR, используя репозиторий Maven.
  2. Создайте экземпляр объекта Document Class для загрузки исходного документа.
  3. Укажите различные параметры HtmlSaveOptions, включая поля страницы, CssStyleSheet, параметры страницы и т. д.
  4. Экспорт DOCX в HTML на Java с использованием метода сохранения

В следующем примере кода мы сначала загрузим исходный DOCX, используя экземпляр класса Document. Затем, используя экземпляр класса HtmlSaveOptions, мы установим CssStyleSheetType, ExportPageMargins и ImageResolution. Наконец, используя метод сохранения, мы сгенерируем HTML из DOCX в Java.

Код для экспорта DOCX в HTML на Java

В этом примере кода мы загрузили исходный DOCX, используя экземпляр класса Document. Экземпляр HtmlSaveOptions class можно использовать для установки различных параметров, таких как кодировка, параметры SVG, версия и многие другие свойства. Наконец, мы экспортируем DOCX в HTML с помощью Java.

В предыдущем разделе как конвертировать DOCX в TIFF с помощью Java мы сосредоточились на преобразовании DOCX в TIFF. Принимая во внимание, что в этом разделе мы узнали, как генерировать HTML из DOCX с помощью Java.

 Русский