这个简短的操作指南指导如何在 C# 中阅读 PDF 表并阅读其中的所有内容。它为解析 PDF 文件中的所有表格,然后访问特定表格的每个单独的行和单元格提供了详细说明。为了从 PDF 中读取表格,C# 代码由几行组成,其中源 PDF 文件被加载,然后解析所有表格以读取内容。
在 C# 中读取 PDF 表格的步骤
- 添加对 Aspose.PDF for .NET 的引用以读取 PDF 中的表格数据
- 使用 Document 类对象加载源 PDF 文件
- 实例化 TableAbsorber 类对象并从所需的 PDF 页面读取所有表格
- 遍历目标 PDF 表中的所有行
- 迭代每行中的所有单元格并获取所有文本片段
- 显示或处理单元格中的每个文本片段
在这些步骤中遵循系统的方法来在 C# 中读取 PDF 表,其中首先加载 PDF 文件,然后使用 TableAbsorber 类对象解析所有表。一旦访问了 PDF 文件中的所有表,您就可以获得对已解析集合中任何表的引用。您可以访问 PDF 文件中的任何表格、行、单元格和文本片段以进行处理或显示。
在 C# 中读取 PDF 表的代码
在此示例代码中,使用 C# parse PDF table 可以使用用于读取表格的 TableAbsorber 类。但是,您也可以使用 TextAbsorber、ParagraphAbsorber、FontAbsorber 和 TextFragmentAbsorber 等其他选项来访问文档的不同元素。您可以遍历整个集合或使用数组索引访问单个元素。
我们已经在本主题中学习了如何阅读 C# 中的 PDF 表格。但是,如果您想阅读 PDF 书签,请参阅 如何使用 C# 读取 PDF 中的书签 上的文章。