在本教程中,我们将学习如何在 C++ 中读取 PDF 文件。您可以使用 C++ 中的简单 API 调用从 PDF 文件的任何页面或整个文档中提取文本或图像。该功能不依赖于 Adobe Acrobat 或任何在 Windows 或 Linux 平台上阅读 PDF 的应用程序。
用 C++ 读取 PDF 文件的步骤
- 从 NuGet 包管理器工具安装 Aspose.Pdf for C++
- 添加对 Aspose::Pdf 命名空间的引用
- 使用 Document Class 加载输入 PDF
- 初始化一个 TextFragmentAbsorber 类实例
- 在控制台上打印提取的文本
- 遍历文档的每一页和图像
- 将提取的输出图像保存为 JPG 文件
您可以用几行简单的代码打开和阅读 C++ 中的 pdf 文件。它可以有效地从 PDF 文件中提取所有文本和图像。
用 C++ 读取 PDF 文件的代码
在上一主题中,我们探讨了 如何在 C# 中展平 PDF 表单域。本主题重点介绍如何从 C++ 中的 PDF 文件中读取文本。