如何在 Python 中清理 Word 文档中的元数据

本文概述了如何使用 Python 从 Word 文档中清理元数据。它详细介绍了如何设置开发环境以开发和运行所附示例代码以及编程步骤和用于从 Python 中的 Word 中删除元数据的示例可运行代码。您还将了解删除自定义属性和内置属性之间的区别。

使用 Python 从 Word 文档中删除元数据的步骤

  1. 将 IDE 设置为使用 Aspose.Words for Python 通过 .NET 删除元数据
  2. 使用 Document 类对象加载 DOC 文件
  3. 使用 custom_document_properties 属性访问自定义属性集合
  4. 调用集合中的clear()方法一次删除属性和值
  5. 使用built_in_document_properties 属性访问内置属性集合
  6. 调用集合中的clear()方法仅清除值
  7. 保存生成的 Word 文件

列出的步骤提供了一种系统方法来从 Python 中的 Word 文档中清理元数据。该过程非常简单,因为首先加载目标文件,然后访问自定义和内置属性集合。这两个集合都包含可用于删除属性的clear() 方法。

使用 Python 清除 Word 文档元数据的代码

这段简洁的代码说明了在 Python 中删除所有文档属性和个人信息的过程。 custom_document_properties 包含clear() 方法,该方法可以删除属性及其值,而built_in_document_properties 集合中的clear() 方法仅清除值,不会删除属性本身。清除属性后,您可以在保存输出文件之前使用 Document 类中的许多属性进一步操作输出文件。

这段代码教会了我们如何在 Python 中删除所有文档属性和个人信息。如果您想从 Word 文件中删除注释,请参阅 如何使用Python删除Word中的注释 上的文章。

 简体中文