I detta enkla ämne kommer du att lära dig hur du konverterar Word Document till HTML med Java. Följande enkla steg kan användas för att exportera DOCX till HTML i Java i alla vanliga operativsystem som MS Windows, Ubuntu eller macOS med enkla API-anrop.
Steg för att konvertera Word-dokument till HTML med Java
- Lägg till Aspose.Words JAR-filreferens med Maven-förvaret
- Instantiera objektet Document Class för att ladda källdokumentet
- Ange olika HtmlSaveOptions inklusive sidmarginaler, CssStyleSheet och sidinställningar etc.
- Exportera DOCX till HTML i Java med hjälp av sparmetoden
I följande exempelkod kommer vi först att ladda källkoden DOCX med Document class-instans. Med hjälp av HtmlSaveOptions class-instansen kommer vi att ställa in CssStyleSheetType, ExportPageMargins och ImageResolution. Slutligen, med hjälp av sparmetoden kommer vi generera HTML från DOCX i Java.
Kod för att exportera DOCX till HTML i Java
import com.aspose.words.CssStyleSheetType; | |
import com.aspose.words.Document; | |
import com.aspose.words.HtmlSaveOptions; | |
import com.aspose.words.ImageColorMode; | |
import com.aspose.words.ImageSaveOptions; | |
import com.aspose.words.License; | |
import com.aspose.words.SaveFormat; | |
public class WordsKB { | |
public static void main(String[] wordsArgs) throws Exception { | |
{ | |
// Use Aspose.Words for Java license to remove trial version limitations | |
// after converting Word DOCX to HTML | |
License licenseConvertDOCXtoHTML = new License(); | |
licenseConvertDOCXtoHTML.setLicense("Java.Aspose.Words.lic"); | |
// Load input Word DOCX file with Document class | |
Document sourceDoc = new Document("Input.docx"); | |
// Set different properties of HtmlSaveOptions class | |
HtmlSaveOptions saveOptions = new HtmlSaveOptions(); | |
saveOptions.setCssStyleSheetType(CssStyleSheetType.INLINE); | |
saveOptions.setExportPageMargins(true); | |
saveOptions.setImageResolution(90); | |
// Export docx to HTML in Java | |
sourceDoc.save("SavedHtml.html", saveOptions); | |
} | |
} |
I den här exempelkoden har vi laddat källkoden DOCX med en instans av Document class. HtmlSaveOptions class-instansen kan användas för att ställa in olika alternativ som kodning, SVG-alternativ, version och många andra egenskaper. Slutligen exporterar vi DOCX till HTML med Java.
I tidigare ämne av hur man konverterar DOCX till TIFF med Java fokuserade vi på att rendera DOCX till TIFF. Medan vi i det här ämnet har lärt oss hur man genererar HTML från DOCX med Java.