Dit artikel geeft een overzicht van hoe je metadata van een Word document opschoont in Python. Het bevat details over het instellen van de ontwikkelomgeving om de bijgevoegde voorbeeldcode te ontwikkelen en uit te voeren, samen met de programmeerstappen en een uitvoerbare voorbeeldcode voor het verwijderen van metadata uit Word in Python. U leert ook het verschil tussen het verwijderen van de aangepaste eigenschappen en de ingebouwde eigenschappen.
Stappen om metagegevens uit Word-document in Python te verwijderen
- Stel de IDE in om Aspose.Words voor Python via .NET te gebruiken om de metadata te verwijderen
- Laad het DOC-bestand met behulp van het klasseobject Document
- Krijg toegang tot de verzameling aangepaste eigenschappen met de eigenschap custom_document_properties
- Roep de methode clear() in de verzameling aan om de eigenschappen en waarden tegelijk te verwijderen
- Open de ingebouwde verzameling eigenschappen met behulp van de eigenschap built_in_document_properties
- Roep de methode clear() in de verzameling aan om alleen de waarden te wissen
- Sla het resulterende Word-bestand op
De vermelde stappen bieden een systematische benadering om metadata van Word-document in Python op te schonen. Het proces is vrij eenvoudig omdat eerst het doelbestand wordt geladen en vervolgens toegang wordt verkregen tot de aangepaste en ingebouwde eigenschappenverzamelingen. Beide collecties bevatten de methode clear() die kan worden gebruikt om de eigenschappen te verwijderen.
Code om metagegevens uit Word-document in Python te wissen
Deze beknopte code illustreert het proces om alle documenteigenschappen en persoonlijke informatie in Python te verwijderen. De custom_document_properties bevat de clear() methode die zowel de eigenschap als zijn waarde kan verwijderen, terwijl de clear() methode in de built_in_document_properties collectie alleen de waarden wist en de eigenschap zelf niet verwijdert. Nadat de eigenschappen zijn gewist, kunt u het uitvoerbestand verder manipuleren met behulp van een aantal eigenschappen in de klasse Document voordat u het uitvoerbestand opslaat.
Deze code heeft ons geleerd hoe alle documenteigenschappen en persoonlijke informatie in Python te verwijderen. Als je de opmerkingen uit een Word-bestand wilt verwijderen, raadpleeg dan het artikel op hoe opmerkingen in Word te verwijderen met behulp van Python.