如何使用 Java 将 Word 文档转换为 HTML

在这个简单的主题中,您将学习如何使用 Java** 将 Word Document 转换为 HTML。以下简单步骤可用于在任何常见操作系统(如 MS Windows、Ubuntu 或 macOS)中使用简单的 API 调用将 DOCX 导出为 Java 中的 HTML。

使用 Java 将 Word 文档转换为 HTML 的步骤

  1. 使用 Maven 存储库添加 Aspose.Words JAR 文件引用
  2. 实例化 Document Class 对象以加载源文档
  3. 指定不同的 HtmlSaveOptions 包括页边距、CssStyleSheet 和页面设置等。
  4. 使用 save 方法将 DOCX 导出为 Java 中的 HTML

在下面的示例代码中,我们将首先使用 Document class 实例加载源 DOCX。然后使用 HtmlSaveOptions 类 实例,我们将设置 CssStyleSheetType、ExportPageMargins 和 ImageResolution。最后,使用 save 方法,我们将从 Java 中的 DOCX 生成 HTML

在 Java 中将 DOCX 导出为 HTML 的代码

在此示例代码中,我们使用 Document 类 的实例加载了源 DOCX。 HtmlSaveOptions class 实例可用于设置不同的选项,如编码、SVG 选项、版本和许多其他属性。最后,我们使用 Java 将 DOCX 导出为 HTML*。

如何使用 Java 将 DOCX 转换为 TIFF 的上一个主题中,我们专注于将 DOCX 渲染为 TIFF。然而,在本主题中,我们学习了如何使用 Java 从 DOCX 生成 HTML

 简体中文