В этом простом разделе вы узнаете, как преобразовать Word Document в HTML с помощью Java. Следующие простые шаги можно использовать для экспорта DOCX в HTML на Java в любой распространенной операционной системе, такой как MS Windows, Ubuntu или macOS, с помощью простых вызовов API.
Шаги для преобразования документа Word в HTML с использованием Java
- Добавьте ссылку на Aspose.Words файл JAR, используя репозиторий Maven.
- Создайте экземпляр объекта Document Class для загрузки исходного документа.
- Укажите различные параметры HtmlSaveOptions, включая поля страницы, CssStyleSheet, параметры страницы и т. д.
- Экспорт DOCX в HTML на Java с использованием метода сохранения
В следующем примере кода мы сначала загрузим исходный DOCX, используя экземпляр класса Document. Затем, используя экземпляр класса HtmlSaveOptions, мы установим CssStyleSheetType, ExportPageMargins и ImageResolution. Наконец, используя метод сохранения, мы сгенерируем HTML из DOCX в Java.
Код для экспорта DOCX в HTML на Java
import com.aspose.words.CssStyleSheetType; | |
import com.aspose.words.Document; | |
import com.aspose.words.HtmlSaveOptions; | |
import com.aspose.words.ImageColorMode; | |
import com.aspose.words.ImageSaveOptions; | |
import com.aspose.words.License; | |
import com.aspose.words.SaveFormat; | |
public class WordsKB { | |
public static void main(String[] wordsArgs) throws Exception { | |
{ | |
// Use Aspose.Words for Java license to remove trial version limitations | |
// after converting Word DOCX to HTML | |
License licenseConvertDOCXtoHTML = new License(); | |
licenseConvertDOCXtoHTML.setLicense("Java.Aspose.Words.lic"); | |
// Load input Word DOCX file with Document class | |
Document sourceDoc = new Document("Input.docx"); | |
// Set different properties of HtmlSaveOptions class | |
HtmlSaveOptions saveOptions = new HtmlSaveOptions(); | |
saveOptions.setCssStyleSheetType(CssStyleSheetType.INLINE); | |
saveOptions.setExportPageMargins(true); | |
saveOptions.setImageResolution(90); | |
// Export docx to HTML in Java | |
sourceDoc.save("SavedHtml.html", saveOptions); | |
} | |
} |
В этом примере кода мы загрузили исходный DOCX, используя экземпляр класса Document. Экземпляр HtmlSaveOptions class можно использовать для установки различных параметров, таких как кодировка, параметры SVG, версия и многие другие свойства. Наконец, мы экспортируем DOCX в HTML с помощью Java.
В предыдущем разделе как конвертировать DOCX в TIFF с помощью Java мы сосредоточились на преобразовании DOCX в TIFF. Принимая во внимание, что в этом разделе мы узнали, как генерировать HTML из DOCX с помощью Java.