在本快速教程中,您将学习如何在 Java 中**将 PDF 转换为 HTML。通过采用简单的步骤和在 Windows、macOS 或 Linux 中执行的代码,无需依赖 Adobe Acrobat 或任何其他第三方工具,即可轻松地将 PDF 保存为 Java 中的 HTML。
在 Java 中将 PDF 转换为 HTML 的步骤
- 配置您的项目以添加来自 Maven 存储库的 Aspose.PDF for Java 引用
- 在您的项目中添加对 Aspose.PDF 命名空间的引用
- 实例化 Document class 对象以加载 PDF 以导出为 HTML
- 创建 HtmlSaveOptions 对象以设置不同的 HTML 选项
- 使用 Save 方法在 Java 中将 PDF 转换为 HTML
为了开发 PDF 到 HTML 转换器,可以使用基于 Java 的应用程序。该过程将从包含 API 参考和从磁盘加载源 PDF 文件开始。在后续步骤中,HtmlSaveOptions 类将用于设置所需的 HTML 文件导出选项。最后,将使用 Save 方法和 SaveFormat.Html 枚举器保存生成的 HTML。
在 Java 中将 PDF 保存为 HTML 的代码
通过使用上面的例子,Java PDF 到 HTML 的转换可以很容易地实现。我们使用 HtmlSaveOptions 类自定义了 HTML 输出,该类提供设置 SVG 导出选项(如压缩和 SVG 内容)以及从源 PDF 导出图像的路径设置。您还可以管理导出的 HTML 中的字体以及将 PDF 页面拆分为多页 HTML 输出的选项。最后,我们可以将生成的 HTML 保存在磁盘上或 MemoryStream 中以供进一步使用。
在上面的示例中,我们学习了使用自定义输出将 PDF 转换为 Java 中的 HTML。如果您希望以编程方式创建 PDF,请参阅 如何使用 Java 创建 PDF 上的文章。