Hur man konverterar Word-dokument till HTML med Java

I detta enkla ämne kommer du att lära dig hur du konverterar Word Document till HTML med Java. Följande enkla steg kan användas för att exportera DOCX till HTML i Java i alla vanliga operativsystem som MS Windows, Ubuntu eller macOS med enkla API-anrop.

Steg för att konvertera Word-dokument till HTML med Java

  1. Lägg till Aspose.Words JAR-filreferens med Maven-förvaret
  2. Instantiera objektet Document Class för att ladda källdokumentet
  3. Ange olika HtmlSaveOptions inklusive sidmarginaler, CssStyleSheet och sidinställningar etc.
  4. Exportera DOCX till HTML i Java med hjälp av sparmetoden

I följande exempelkod kommer vi först att ladda källkoden DOCX med Document class-instans. Med hjälp av HtmlSaveOptions class-instansen kommer vi att ställa in CssStyleSheetType, ExportPageMargins och ImageResolution. Slutligen, med hjälp av sparmetoden kommer vi generera HTML från DOCX i Java.

Kod för att exportera DOCX till HTML i Java

import com.aspose.words.CssStyleSheetType;
import com.aspose.words.Document;
import com.aspose.words.HtmlSaveOptions;
import com.aspose.words.ImageColorMode;
import com.aspose.words.ImageSaveOptions;
import com.aspose.words.License;
import com.aspose.words.SaveFormat;
public class WordsKB {
public static void main(String[] wordsArgs) throws Exception {
{
// Use Aspose.Words for Java license to remove trial version limitations
// after converting Word DOCX to HTML
License licenseConvertDOCXtoHTML = new License();
licenseConvertDOCXtoHTML.setLicense("Java.Aspose.Words.lic");
// Load input Word DOCX file with Document class
Document sourceDoc = new Document("Input.docx");
// Set different properties of HtmlSaveOptions class
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.INLINE);
saveOptions.setExportPageMargins(true);
saveOptions.setImageResolution(90);
// Export docx to HTML in Java
sourceDoc.save("SavedHtml.html", saveOptions);
}
}

I den här exempelkoden har vi laddat källkoden DOCX med en instans av Document class. HtmlSaveOptions class-instansen kan användas för att ställa in olika alternativ som kodning, SVG-alternativ, version och många andra egenskaper. Slutligen exporterar vi DOCX till HTML med Java.

I tidigare ämne av hur man konverterar DOCX till TIFF med Java fokuserade vi på att rendera DOCX till TIFF. Medan vi i det här ämnet har lärt oss hur man genererar HTML från DOCX med Java.

 Svenska