Den här artikeln ger en översikt över hur man rengör metadata från Word dokument i Python. Den har detaljer om att ställa in utvecklingsmiljön för att utveckla och köra den bifogade exempelkoden tillsammans med programmeringsstegen och ett exempel på körbar kod för att ta bort metadata från Word i Python. Du kommer också att lära dig skillnaden mellan att ta bort de anpassade egenskaperna och de inbyggda egenskaperna.
Steg för att ta bort metadata från Word-dokument i Python
- Ställ in IDE att använda Aspose.Words för Python via .NET för att ta bort metadata
- Ladda DOC-filen med klassobjektet Document
- Få tillgång till den anpassade egenskapssamlingen med custom_document_properties-egenskapen
- Anrop clear()-metoden i samlingen för att ta bort egenskaperna och värdena båda åt gången
- Få tillgång till samlingen av inbyggda egenskaper med egenskapen built_in_document_properties
- Anrop clear()-metoden i samlingen för att endast rensa värdena
- Spara den resulterande Word-filen
De listade stegen erbjuder ett systematiskt tillvägagångssätt för att rena metadata från Word-dokument i Python. Processen är ganska enkel eftersom målfilen först laddas och därefter de anpassade och inbyggda egenskapssamlingarna nås. Båda samlingarna innehåller metoden clear() som kan användas för att ta bort egenskaperna.
Kod för att rensa metadata från Word-dokument i Python
Denna kortfattade kod illustrerar processen för att ta bort alla dokumentegenskaper och personlig information i Python. Custom_document_properties innehåller metoden clear() som kan ta bort egenskapen och dess värde, medan clear()-metoden i samlingen built_in_document_properties bara rensar värdena och inte tar bort själva egenskapen. När egenskaperna är rensade kan du manipulera utdatafilen ytterligare med hjälp av ett antal egenskaper i klassen Document innan du sparar utdatafilen.
Den här koden har utbildat oss om hur man tar bort alla dokumentegenskaper och personlig information i Python. Om du vill ta bort kommentarerna från en Word-fil, se artikeln om hur man tar bort kommentarer i Word med Python.