Javaを使用してWord文書をHTMLに変換する方法

この簡単なトピックでは、Javaを使用してWord DocumentHTMLに変換する方法を学習します。次の簡単な手順を使用して、MS Windows、Ubuntu、macOSなどの一般的なオペレーティングシステムで、簡単なAPI呼び出しを使用してJavaでDOCXをHTMLにエクスポートできます。

Javaを使用してWord文書をHTMLに変換する手順

  1. Mavenリポジトリを使用してAspose.WordsJARファイル参照を追加します
  2. Document Classオブジェクトをインスタンス化して、ソースドキュメントをロードします
  3. ページマージン、CssStyleSheet、ページ設定など、さまざまなHtmlSaveOptionsを指定します。
  4. saveメソッドを使用してJavaでDOCXをHTMLにエクスポートする

次のサンプルコードでは、最初に* Documentclassインスタンスを使用してソースDOCXをロードします。次に、 HtmlSaveOptionsクラス*インスタンスを使用して、CssStyleSheetType、ExportPageMargins、およびImageResolutionを設定します。最後に、saveメソッドを使用して、JavaのDOCXからHTMLを生成します

JavaでDOCXをHTMLにエクスポートするコード

import com.aspose.words.CssStyleSheetType;
import com.aspose.words.Document;
import com.aspose.words.HtmlSaveOptions;
import com.aspose.words.ImageColorMode;
import com.aspose.words.ImageSaveOptions;
import com.aspose.words.License;
import com.aspose.words.SaveFormat;
public class WordsKB {
public static void main(String[] wordsArgs) throws Exception {
{
// Use Aspose.Words for Java license to remove trial version limitations
// after converting Word DOCX to HTML
License licenseConvertDOCXtoHTML = new License();
licenseConvertDOCXtoHTML.setLicense("Java.Aspose.Words.lic");
// Load input Word DOCX file with Document class
Document sourceDoc = new Document("Input.docx");
// Set different properties of HtmlSaveOptions class
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.INLINE);
saveOptions.setExportPageMargins(true);
saveOptions.setImageResolution(90);
// Export docx to HTML in Java
sourceDoc.save("SavedHtml.html", saveOptions);
}
}

このサンプルコードでは、Documentクラスのインスタンスを使用してソースDOCXをロードしました。 * HtmlSaveOptions class *インスタンスを使用して、エンコーディング、SVGオプション、バージョン、その他の多くのプロパティなどのさまざまなオプションを設定できます。最後に、Javaを使用してDOCXをHTMLにエクスポートします

Javaを使用してDOCXをTIFFに変換する方法の前のトピックでは、DOCXをTIFFにレンダリングすることに焦点を当てました。一方、このトピックでは、Javaを使用してDOCXからHTMLを生成する方法を学びました。

 日本語