U ovoj jednostavnoj temi naučit ćete kako pretvoriti Word Document u HTML pomoću Jave. Sljedeći jednostavni koraci mogu se koristiti za izvoz DOCX-a u HTML u Javi u bilo kojem uobičajenom operativnom sustavu kao što su MS Windows, Ubuntu ili macOS pomoću jednostavnih API poziva.
Koraci za pretvaranje Word dokumenta u HTML pomoću Jave
- Dodajte Aspose.Words referencu JAR datoteke koristeći Maven repozitorij
- Instancirajte objekt Document Class za učitavanje izvornog dokumenta
- Navedite različite opcije HtmlSaveOptions uključujući margine stranice, CssStyleSheet i postavke stranice itd.
- Izvezite DOCX u HTML u Javi pomoću metode spremanja
U sljedećem primjeru koda prvo ćemo učitati izvorni DOCX pomoću instance Document class. Zatim ćemo pomoću instance klase HtmlSaveOptions postaviti CssStyleSheetType, ExportPageMargins i ImageResolution. Na kraju, korištenjem metode spremanja mi ćemo generirati HTML iz DOCX-a u Javi.
Kod za izvoz DOCX u HTML u Javi
import com.aspose.words.CssStyleSheetType; | |
import com.aspose.words.Document; | |
import com.aspose.words.HtmlSaveOptions; | |
import com.aspose.words.ImageColorMode; | |
import com.aspose.words.ImageSaveOptions; | |
import com.aspose.words.License; | |
import com.aspose.words.SaveFormat; | |
public class WordsKB { | |
public static void main(String[] wordsArgs) throws Exception { | |
{ | |
// Use Aspose.Words for Java license to remove trial version limitations | |
// after converting Word DOCX to HTML | |
License licenseConvertDOCXtoHTML = new License(); | |
licenseConvertDOCXtoHTML.setLicense("Java.Aspose.Words.lic"); | |
// Load input Word DOCX file with Document class | |
Document sourceDoc = new Document("Input.docx"); | |
// Set different properties of HtmlSaveOptions class | |
HtmlSaveOptions saveOptions = new HtmlSaveOptions(); | |
saveOptions.setCssStyleSheetType(CssStyleSheetType.INLINE); | |
saveOptions.setExportPageMargins(true); | |
saveOptions.setImageResolution(90); | |
// Export docx to HTML in Java | |
sourceDoc.save("SavedHtml.html", saveOptions); | |
} | |
} |
U ovom uzorku koda učitali smo izvorni DOCX pomoću instance Document class. Instanca HtmlSaveOptions class može se koristiti za postavljanje različitih opcija kao što su kodiranje, SVG opcije, verzija i mnoga druga svojstva. Konačno, izvozimo DOCX u HTML pomoću Jave.
U prethodnoj temi kako pretvoriti DOCX u TIFF pomoću Jave fokusirali smo se na pretvaranje DOCX u TIFF. Dok smo u ovoj temi naučili kako generirati HTML iz DOCX-a pomoću Jave.