这个简短的操作主题重点介绍如何在 C#** 中将 PDF 转换为 HTML。您可以使用简单的 API 调用将 PDF 导出为 C# 中的 HTML,而无需依赖 Adobe Acrobat 或任何其他第三方工具。此应用程序可用于在 MS Windows、Linux 或 macOS 操作系统中运行的任何基于 .NET 的应用程序。
在 C# 中将 PDF 转换为 HTML 的步骤
- 在您的应用程序中使用 NuGet 包工具安装 Aspose.PDF
- 在您的应用程序中添加对 Aspose.PDF 命名空间的引用
- 初始化 Document 类实例以加载 PDF 并将其转换为 HTML
- 初始化 HtmlSaveOptions 对象以设置字体、SVG 和图像保存选项
- 最后,使用 Save 方法在 C# 中将 PDF 转换为 HTML
按照上述 C# PDF 到 HTML 的步骤,使用简单的 API 调用就可以实现。您将首先添加必要的 API 参考,然后加载源 PDF 文件。稍后,您将使用 HtmlSaveOptions 类设置导出的 HTML 所需的必要选项。最后,通过在 Save 方法中使用 SaveFormat.Html 枚举器,HTML 将保存在磁盘上。
在 C# 中将 PDF 转换为 HTML 的代码
上面 C# 中的示例通过使用 HtmlSaveOptions 类将 PDF 转换为 HTML,这将使您能够设置诸如将 PDF 拆分为多个页面和管理字体设置等选项。它还允许您设置 SVG 导出选项,例如 SVG 内容的压缩和路径,以及从源 PDF 导出的图像的路径设置。最后,将所需的 HTML 文件保存在磁盘或 MemoryStream 中以供进一步使用。
我们见证了在 C# 中将 PDF 转换为 HTML 并获得自定义输出是多么方便。如果您有兴趣将 PDF 文件保存为图像,请参阅 如何在 C# 中将 PDF 转换为图像 上的文章。