本简短指南解释了如何使用 Python 清除 PDF 中的元数据。它包含设置开发环境的详细信息、编程任务列表以及使用 Python 剥离 PDF 元数据的可运行示例代码。它将指导您一一删除默认属性以及所有自定义属性。
使用 Python 从 PDF 中删除元数据的步骤
- 将环境设置为 通过 .NET 使用 Aspose.PDF for Python 以清理元数据
- 使用 Document 类加载源 PDF 文件以删除元数据
- 如果需要,创建并使用元数据显示功能
- 使用 DocumentInfo 类对象访问元数据
- 使用remove()方法清除默认元数据
- 删除自定义元数据
- 保存生成的 PDF 文件
这些步骤总结了使用 Python 从 PDF 中清理元数据的过程。将源 PDF 文件加载到 Document 类中,然后使用 DocumentInfo 访问元数据。通过调用以属性名称作为参数的remove()方法来删除默认属性,并调用clear_custom_data()方法来删除所有自定义属性。
使用 Python 删除 PDF 元数据的代码
此代码演示了如何使用 Python 从 PDF 中清除元数据。我们使用 DisplayMetadata() 方法来选择显示删除之前和之后的元数据。 DocumentInfo.remove() 方法需要默认属性名称,而clear_custom_data() 方法不需要任何参数来删除自定义属性。
在本文中,我们了解了使用 Python* 开发 PDF *元数据删除工具的过程。如果您想删除 PDF 文件的不同限制,请参阅 如何在Python中删除PDF文档的限制 上的文章。