V tomto jednoduchém tématu se dozvíte, jak převést Word Document na HTML pomocí Javy. Následující jednoduché kroky lze použít k exportu DOCX do HTML v Javě v jakémkoli běžném operačním systému, jako je MS Windows, Ubuntu nebo macOS pomocí jednoduchých volání API.
Kroky k převodu dokumentu Word do HTML pomocí Java
- Přidejte Aspose.Words odkaz na soubor JAR pomocí úložiště Maven
- Chcete-li načíst zdrojový dokument, vytvořte instanci objektu Document Class
- Zadejte různé možnosti HtmlSaveOptions včetně okrajů stránky, CssStyleSheet a Nastavení stránky atd.
- Export DOCX do HTML v Javě pomocí metody uložení
V následujícím ukázkovém kódu nejprve načteme zdrojový DOCX pomocí instance Document class. Poté pomocí instance třídy HtmlSaveOptions nastavíme CssStyleSheetType, ExportPageMargins a ImageResolution. Nakonec pomocí metody save vygenerujeme HTML z DOCX v Javě.
Kód pro export DOCX do HTML v Javě
import com.aspose.words.CssStyleSheetType; | |
import com.aspose.words.Document; | |
import com.aspose.words.HtmlSaveOptions; | |
import com.aspose.words.ImageColorMode; | |
import com.aspose.words.ImageSaveOptions; | |
import com.aspose.words.License; | |
import com.aspose.words.SaveFormat; | |
public class WordsKB { | |
public static void main(String[] wordsArgs) throws Exception { | |
{ | |
// Use Aspose.Words for Java license to remove trial version limitations | |
// after converting Word DOCX to HTML | |
License licenseConvertDOCXtoHTML = new License(); | |
licenseConvertDOCXtoHTML.setLicense("Java.Aspose.Words.lic"); | |
// Load input Word DOCX file with Document class | |
Document sourceDoc = new Document("Input.docx"); | |
// Set different properties of HtmlSaveOptions class | |
HtmlSaveOptions saveOptions = new HtmlSaveOptions(); | |
saveOptions.setCssStyleSheetType(CssStyleSheetType.INLINE); | |
saveOptions.setExportPageMargins(true); | |
saveOptions.setImageResolution(90); | |
// Export docx to HTML in Java | |
sourceDoc.save("SavedHtml.html", saveOptions); | |
} | |
} |
V tomto ukázkovém kódu jsme načetli zdrojový DOCX pomocí instance Document class. Instanci HtmlSaveOptions class lze použít k nastavení různých možností, jako je kódování, možnosti SVG, verze a mnoho dalších vlastností. Nakonec exportujeme DOCX do HTML pomocí Javy.
V předchozím tématu jak převést DOCX na TIFF pomocí Javy jsme se zaměřili na vykreslování DOCX do formátu TIFF. Zatímco v tomto tématu jsme se naučili, jak generovat HTML z DOCX pomocí Java.