В этой статье представлен обзор того, как очистить метаданные из документа Word в Python. В нем содержится подробная информация о настройке среды разработки для разработки и запуска прилагаемого примера кода, а также шаги программирования и пример исполняемого кода для удаления метаданных из Word в Python. Вы также узнаете разницу между удалением пользовательских свойств и встроенных свойств.
Шаги по удалению метаданных из документа Word в Python
- Настройте IDE на использование Aspose.Words для Python через .NET для удаления метаданных.
- Загрузите файл DOC, используя объект класса Document
- Получите доступ к коллекции настраиваемых свойств с помощью свойства custom_document_properties.
- Вызовите метод clear() в коллекции, чтобы одновременно удалить свойства и значения.
- Получите доступ к коллекции встроенных свойств с помощью свойства built_in_document_properties.
- Вызовите метод clear() в коллекции, чтобы очистить только значения
- Сохраните полученный файл Word
Перечисленные шаги предлагают систематический подход к * очистке метаданных из документа Word в Python *. Процесс довольно прост, так как сначала загружается целевой файл, а затем осуществляется доступ к пользовательским и встроенным коллекциям свойств. Обе коллекции содержат метод clear(), который можно использовать для удаления свойств.
Код для очистки метаданных из документа Word в Python
import aspose.words as aw | |
import aspose.pydrawing as drawing | |
# Load the license | |
wordLic = aw.License() | |
wordLic.set_license("Aspose.Total.lic") | |
# Load the DOC file | |
doc = aw.Document("SampleProps.doc") | |
# Get the custom properties collection and clear them | |
custProps = doc.custom_document_properties | |
custProps.clear() | |
# Get the built-in properties collection and clear them | |
builtInProps = doc.built_in_document_properties | |
builtInProps.clear() | |
# Save the Word file | |
doc.save("Output.doc") | |
print ("Metadata removed from the Word file") |
Этот краткий код иллюстрирует процесс удаления всех свойств документа и личной информации в Python. custom_document_properties содержит метод clear(), который может удалить как свойство, так и его значение, в то время как метод clear() в коллекции Built_in_document_properties только очищает значения, но не удаляет само свойство. После того, как свойства очищены, вы можете манипулировать выходным файлом, используя ряд свойств в классе Document перед сохранением выходного файла.
Этот код показал нам как удалить все свойства документа и личную информацию в Python. Если вы хотите удалить комментарии из файла Word, обратитесь к статье как удалить комментарии в Word с помощью Python.