如何使用 Python 清理 PDF 中的元数据

本简短指南解释了如何使用 Python 清除 PDF 中的元数据。它包含设置开发环境的详细信息、编程任务列表以及使用 Python 剥离 PDF 元数据的可运行示例代码。它将指导您一一删除默认属性以及所有自定义属性。

使用 Python 从 PDF 中删除元数据的步骤

  1. 将环境设置为 通过 .NET 使用 Aspose.PDF for Python 以清理元数据
  2. 使用 Document 类加载源 PDF 文件以删除元数据
  3. 如果需要,创建并使用元数据显示功能
  4. 使用 DocumentInfo 类对象访问元数据
  5. 使用remove()方法清除默认元数据
  6. 删除自定义元数据
  7. 保存生成的 PDF 文件

这些步骤总结了使用 Python 从 PDF 中清理元数据的过程。将源 PDF 文件加载到 Document 类中,然后使用 DocumentInfo 访问元数据。通过调用以属性名称作为参数的remove()方法来删除默认属性,并调用clear_custom_data()方法来删除所有自定义属性。

使用 Python 删除 PDF 元数据的代码

此代码演示了如何使用 Python 从 PDF 中清除元数据。我们使用 DisplayMetadata() 方法来选择显示删除之前和之后的元数据。 DocumentInfo.remove() 方法需要默认属性名称,而clear_custom_data() 方法不需要任何参数来删除自定义属性。

在本文中,我们了解了使用 Python* 开发 PDF *元数据删除工具的过程。如果您想删除 PDF 文件的不同限制,请参阅 如何在Python中删除PDF文档的限制 上的文章。

 简体中文