这个简短的教程描述了如何在 Java 中获取 PDF 元数据。它逐步解释了配置环境后打开源 PDF 文件并提取其元数据的完整过程。您不仅将检查 Java 中的 PDF 元数据,还将学习将自定义元数据添加到 PDF 文件。
在 Java 中读取 PDF 元数据的步骤
- 建立 IDE 环境以从存储库中添加 Aspose.PDF for Java 以获取元数据
- 将输入的 PDF 文件加载到 Document 类对象中以读取元数据
- 使用 getInfo() 方法从加载的 PDF 中填充 DocumentInfo 类对象
- 显示 DocumentInfo 对象中所有需要的属性
这些简单的步骤解释了在 Java 中查看 PDF 元数据的过程。首先,您必须从磁盘或流中加载源 PDF 文件,然后使用 getInfo() 获取对 DocumentInfo 对象的引用,其中包含所有必需的属性,如创建者、修改日期、修改日期时区、创建日期和生产商仅举几例。此类具有更新现有元数据的方法以及添加自定义信息的选项。
Java中从PDF中提取元数据的代码
此代码演示了使用 DocumentInfo 类在 Java 中获取 PDF 元数据的过程。您可以获取其他属性,例如被捕获的标志,检查特定属性是否是预定义的、标题、主题和作者。所有这些属性都可以使用 setter 方法以及使用 set_Item() 方法添加自定义属性并使用 get_Item() 检索相同的选项来设置。
在本快速教程中,我们学习了从 PDF 文件中提取元数据。如果您想了解阅读 PDF 文件中书签的过程,请参阅 如何使用 Java 读取 PDF 中的书签 上的文章。