Kako pretvoriti Word dokument u HTML pomoću Jave

U ovoj jednostavnoj temi naučit ćete kako pretvoriti Word Document u HTML pomoću Jave. Sljedeći jednostavni koraci mogu se koristiti za izvoz DOCX-a u HTML u Javi u bilo kojem uobičajenom operativnom sustavu kao što su MS Windows, Ubuntu ili macOS pomoću jednostavnih API poziva.

Koraci za pretvaranje Word dokumenta u HTML pomoću Jave

  1. Dodajte Aspose.Words referencu JAR datoteke koristeći Maven repozitorij
  2. Instancirajte objekt Document Class za učitavanje izvornog dokumenta
  3. Navedite različite opcije HtmlSaveOptions uključujući margine stranice, CssStyleSheet i postavke stranice itd.
  4. Izvezite DOCX u HTML u Javi pomoću metode spremanja

U sljedećem primjeru koda prvo ćemo učitati izvorni DOCX pomoću instance Document class. Zatim ćemo pomoću instance klase HtmlSaveOptions postaviti CssStyleSheetType, ExportPageMargins i ImageResolution. Na kraju, korištenjem metode spremanja mi ćemo generirati HTML iz DOCX-a u Javi.

Kod za izvoz DOCX u HTML u Javi

import com.aspose.words.CssStyleSheetType;
import com.aspose.words.Document;
import com.aspose.words.HtmlSaveOptions;
import com.aspose.words.ImageColorMode;
import com.aspose.words.ImageSaveOptions;
import com.aspose.words.License;
import com.aspose.words.SaveFormat;
public class WordsKB {
public static void main(String[] wordsArgs) throws Exception {
{
// Use Aspose.Words for Java license to remove trial version limitations
// after converting Word DOCX to HTML
License licenseConvertDOCXtoHTML = new License();
licenseConvertDOCXtoHTML.setLicense("Java.Aspose.Words.lic");
// Load input Word DOCX file with Document class
Document sourceDoc = new Document("Input.docx");
// Set different properties of HtmlSaveOptions class
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.INLINE);
saveOptions.setExportPageMargins(true);
saveOptions.setImageResolution(90);
// Export docx to HTML in Java
sourceDoc.save("SavedHtml.html", saveOptions);
}
}

U ovom uzorku koda učitali smo izvorni DOCX pomoću instance Document class. Instanca HtmlSaveOptions class može se koristiti za postavljanje različitih opcija kao što su kodiranje, SVG opcije, verzija i mnoga druga svojstva. Konačno, izvozimo DOCX u HTML pomoću Jave.

U prethodnoj temi kako pretvoriti DOCX u TIFF pomoću Jave fokusirali smo se na pretvaranje DOCX u TIFF. Dok smo u ovoj temi naučili kako generirati HTML iz DOCX-a pomoću Jave.

 Hrvatski