如何使用 C# 在 PDF 中查找和替换文本

本快速指南介绍了如何使用 C# 在详细步骤和可运行代码的帮助下查找和替换 PDF 中的文本。它有助于配置环境,然后提供一个分步过程来使用 C# 替换 PDF 中的文本。文件更新后,您可以将其以原始格式(即 PDFDOCX、Excel、HTML 等)保存在磁盘上。

使用 C# 在 PDF 中查找和替换文本的步骤

  1. 使用 NuGet 包管理器将项目配置为使用 Aspose.PDF for .NET
  2. 使用 Document 类对象创建或加载包含示例文本的 PDF 文件
  3. 使用 TextFragmentAbsorber 类对象,设置要搜索的文本
  4. 对于输入 PDF 文件中的所有页面,接受文本吸收器
  5. 获取从加载的 PDF 文件中提取文本的片段集合
  6. 解析所有片段并设置新文本
  7. 保存更新的 PDF 文件

这些步骤描述了如何在 PDF 中使用 C# 搜索和替换文本。将创建一个包含一些示例文本的新文件,但是您可以加载一个现有的 PDF 文件,其文本将被替换。有多种选项可用于搜索 PDF 中的文本,例如忽略阴影文本、将搜索限制为页面绑定等。

使用 C# 替换 PDF 中的文本的代码

此代码使用 TextFragmentAbsorber 和 TextFragment 来使用 C# 在 PDF 中查找和替换文本。您不仅可以替换文本,还可以更改生成的 PDF 文件中的字体系列、大小、前景色和背景色。选项也可用于一次替换整个 PDF 中的文本或基于正则表达式替换文本。

在本主题中,我们学习了在 PDF 中查找和替换文本,但是,如果您想学习按页面拆分 PDF 文件,请参阅 如何在C#中按页面拆分PDF文件 上的文章。

 简体中文