如何在 Java 中获取 PDF 元数据

这个简短的教程描述了如何在 Java 中获取 PDF 元数据。它逐步解释了配置环境后打开源 PDF 文件并提取其元数据的完整过程。您不仅将检查 Java 中的 PDF 元数据,还将学习将自定义元数据添加到 PDF 文件。

在 Java 中读取 PDF 元数据的步骤

  1. 建立 IDE 环境以从存储库中添加 Aspose.PDF for Java 以获取元数据
  2. 将输入的 PDF 文件加载到 Document 类对象中以读取元数据
  3. 使用 getInfo() 方法从加载的 PDF 中填充 DocumentInfo 类对象
  4. 显示 DocumentInfo 对象中所有需要的属性

这些简单的步骤解释了在 Java 中查看 PDF 元数据的过程。首先,您必须从磁盘或流中加载源 PDF 文件,然后使用 getInfo() 获取对 DocumentInfo 对象的引用,其中包含所有必需的属性,如创建者、修改日期、修改日期时区、创建日期和生产商仅举几例。此类具有更新现有元数据的方法以及添加自定义信息的选项。

Java中从PDF中提取元数据的代码

此代码演示了使用 DocumentInfo 类在 Java 中获取 PDF 元数据的过程。您可以获取其他属性,例如被捕获的标志,检查特定属性是否是预定义的、标题、主题和作者。所有这些属性都可以使用 setter 方法以及使用 set_Item() 方法添加自定义属性并使用 get_Item() 检索相同的选项来设置。

在本快速教程中,我们学习了从 PDF 文件中提取元数据。如果您想了解阅读 PDF 文件中书签的过程,请参阅 如何使用 Java 读取 PDF 中的书签 上的文章。

 简体中文