如何在 C++ 中读取 PDF 文件

在本教程中,我们将学习如何在 C++ 中读取 PDF 文件。您可以使用 C++ 中的简单 API 调用从 PDF 文件的任何页面或整个文档中提取文本或图像。该功能不依赖于 Adobe Acrobat 或任何在 Windows 或 Linux 平台上阅读 PDF 的应用程序。

用 C++ 读取 PDF 文件的步骤

  1. 从 NuGet 包管理器工具安装 Aspose.Pdf for C++
  2. 添加对 Aspose::Pdf 命名空间的引用
  3. 使用 Document Class 加载输入 PDF
  4. 初始化一个 TextFragmentAbsorber 类实例
  5. 在控制台上打印提取的文本
  6. 遍历文档的每一页和图像
  7. 将提取的输出图像保存为 JPG 文件

您可以用几行简单的代码打开和阅读 C++ 中的 pdf 文件。它可以有效地从 PDF 文件中提取所有文本和图像。

用 C++ 读取 PDF 文件的代码

在上一主题中,我们探讨了 如何在 C# 中展平 PDF 表单域。本主题重点介绍如何从 C++ 中的 PDF 文件中读取文本

 简体中文