Jak převést dokument Word do HTML pomocí Java

V tomto jednoduchém tématu se dozvíte, jak převést Word Document na HTML pomocí Javy. Následující jednoduché kroky lze použít k exportu DOCX do HTML v Javě v jakémkoli běžném operačním systému, jako je MS Windows, Ubuntu nebo macOS pomocí jednoduchých volání API.

Kroky k převodu dokumentu Word do HTML pomocí Java

  1. Přidejte Aspose.Words odkaz na soubor JAR pomocí úložiště Maven
  2. Chcete-li načíst zdrojový dokument, vytvořte instanci objektu Document Class
  3. Zadejte různé možnosti HtmlSaveOptions včetně okrajů stránky, CssStyleSheet a Nastavení stránky atd.
  4. Export DOCX do HTML v Javě pomocí metody uložení

V následujícím ukázkovém kódu nejprve načteme zdrojový DOCX pomocí instance Document class. Poté pomocí instance třídy HtmlSaveOptions nastavíme CssStyleSheetType, ExportPageMargins a ImageResolution. Nakonec pomocí metody save vygenerujeme HTML z DOCX v Javě.

Kód pro export DOCX do HTML v Javě

import com.aspose.words.CssStyleSheetType;
import com.aspose.words.Document;
import com.aspose.words.HtmlSaveOptions;
import com.aspose.words.ImageColorMode;
import com.aspose.words.ImageSaveOptions;
import com.aspose.words.License;
import com.aspose.words.SaveFormat;
public class WordsKB {
public static void main(String[] wordsArgs) throws Exception {
{
// Use Aspose.Words for Java license to remove trial version limitations
// after converting Word DOCX to HTML
License licenseConvertDOCXtoHTML = new License();
licenseConvertDOCXtoHTML.setLicense("Java.Aspose.Words.lic");
// Load input Word DOCX file with Document class
Document sourceDoc = new Document("Input.docx");
// Set different properties of HtmlSaveOptions class
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.INLINE);
saveOptions.setExportPageMargins(true);
saveOptions.setImageResolution(90);
// Export docx to HTML in Java
sourceDoc.save("SavedHtml.html", saveOptions);
}
}

V tomto ukázkovém kódu jsme načetli zdrojový DOCX pomocí instance Document class. Instanci HtmlSaveOptions class lze použít k nastavení různých možností, jako je kódování, možnosti SVG, verze a mnoho dalších vlastností. Nakonec exportujeme DOCX do HTML pomocí Javy.

V předchozím tématu jak převést DOCX na TIFF pomocí Javy jsme se zaměřili na vykreslování DOCX do formátu TIFF. Zatímco v tomto tématu jsme se naučili, jak generovat HTML z DOCX pomocí Java.

 Čeština