Как преобразовать документ Word в HTML с помощью Java

В этом простом разделе вы узнаете, как преобразовать Word Document в HTML с помощью Java. Следующие простые шаги можно использовать для экспорта DOCX в HTML на Java в любой распространенной операционной системе, такой как MS Windows, Ubuntu или macOS, с помощью простых вызовов API.

Шаги для преобразования документа Word в HTML с использованием Java

  1. Добавьте ссылку на Aspose.Words файл JAR, используя репозиторий Maven.
  2. Создайте экземпляр объекта Document Class для загрузки исходного документа.
  3. Укажите различные параметры HtmlSaveOptions, включая поля страницы, CssStyleSheet, параметры страницы и т. д.
  4. Экспорт DOCX в HTML на Java с использованием метода сохранения

В следующем примере кода мы сначала загрузим исходный DOCX, используя экземпляр класса Document. Затем, используя экземпляр класса HtmlSaveOptions, мы установим CssStyleSheetType, ExportPageMargins и ImageResolution. Наконец, используя метод сохранения, мы сгенерируем HTML из DOCX в Java.

Код для экспорта DOCX в HTML на Java

import com.aspose.words.CssStyleSheetType;
import com.aspose.words.Document;
import com.aspose.words.HtmlSaveOptions;
import com.aspose.words.ImageColorMode;
import com.aspose.words.ImageSaveOptions;
import com.aspose.words.License;
import com.aspose.words.SaveFormat;
public class WordsKB {
public static void main(String[] wordsArgs) throws Exception {
{
// Use Aspose.Words for Java license to remove trial version limitations
// after converting Word DOCX to HTML
License licenseConvertDOCXtoHTML = new License();
licenseConvertDOCXtoHTML.setLicense("Java.Aspose.Words.lic");
// Load input Word DOCX file with Document class
Document sourceDoc = new Document("Input.docx");
// Set different properties of HtmlSaveOptions class
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.INLINE);
saveOptions.setExportPageMargins(true);
saveOptions.setImageResolution(90);
// Export docx to HTML in Java
sourceDoc.save("SavedHtml.html", saveOptions);
}
}

В этом примере кода мы загрузили исходный DOCX, используя экземпляр класса Document. Экземпляр HtmlSaveOptions class можно использовать для установки различных параметров, таких как кодировка, параметры SVG, версия и многие другие свойства. Наконец, мы экспортируем DOCX в HTML с помощью Java.

В предыдущем разделе как конвертировать DOCX в TIFF с помощью Java мы сосредоточились на преобразовании DOCX в TIFF. Принимая во внимание, что в этом разделе мы узнали, как генерировать HTML из DOCX с помощью Java.

 Русский