この簡単なトピックでは、Javaを使用してWord DocumentをHTMLに変換する方法を学習します。次の簡単な手順を使用して、MS Windows、Ubuntu、macOSなどの一般的なオペレーティングシステムで、簡単なAPI呼び出しを使用してJavaでDOCXをHTMLにエクスポートできます。
Javaを使用してWord文書をHTMLに変換する手順
- Mavenリポジトリを使用してAspose.WordsJARファイル参照を追加します
- Document Classオブジェクトをインスタンス化して、ソースドキュメントをロードします
- ページマージン、CssStyleSheet、ページ設定など、さまざまなHtmlSaveOptionsを指定します。
- saveメソッドを使用してJavaでDOCXをHTMLにエクスポートする
次のサンプルコードでは、最初に* Documentclassインスタンスを使用してソースDOCXをロードします。次に、 HtmlSaveOptionsクラス*インスタンスを使用して、CssStyleSheetType、ExportPageMargins、およびImageResolutionを設定します。最後に、saveメソッドを使用して、JavaのDOCXからHTMLを生成します。
JavaでDOCXをHTMLにエクスポートするコード
import com.aspose.words.CssStyleSheetType; | |
import com.aspose.words.Document; | |
import com.aspose.words.HtmlSaveOptions; | |
import com.aspose.words.ImageColorMode; | |
import com.aspose.words.ImageSaveOptions; | |
import com.aspose.words.License; | |
import com.aspose.words.SaveFormat; | |
public class WordsKB { | |
public static void main(String[] wordsArgs) throws Exception { | |
{ | |
// Use Aspose.Words for Java license to remove trial version limitations | |
// after converting Word DOCX to HTML | |
License licenseConvertDOCXtoHTML = new License(); | |
licenseConvertDOCXtoHTML.setLicense("Java.Aspose.Words.lic"); | |
// Load input Word DOCX file with Document class | |
Document sourceDoc = new Document("Input.docx"); | |
// Set different properties of HtmlSaveOptions class | |
HtmlSaveOptions saveOptions = new HtmlSaveOptions(); | |
saveOptions.setCssStyleSheetType(CssStyleSheetType.INLINE); | |
saveOptions.setExportPageMargins(true); | |
saveOptions.setImageResolution(90); | |
// Export docx to HTML in Java | |
sourceDoc.save("SavedHtml.html", saveOptions); | |
} | |
} |
このサンプルコードでは、Documentクラスのインスタンスを使用してソースDOCXをロードしました。 * HtmlSaveOptions class *インスタンスを使用して、エンコーディング、SVGオプション、バージョン、その他の多くのプロパティなどのさまざまなオプションを設定できます。最後に、Javaを使用してDOCXをHTMLにエクスポートします。
Javaを使用してDOCXをTIFFに変換する方法の前のトピックでは、DOCXをTIFFにレンダリングすることに焦点を当てました。一方、このトピックでは、Javaを使用してDOCXからHTMLを生成する方法を学びました。