Ten artykuł zawiera omówienie jak czyścić metadane z Word dokumentu w Pythonie. Zawiera szczegółowe informacje na temat konfigurowania środowiska programistycznego do tworzenia i uruchamiania załączonego przykładowego kodu wraz z krokami programowania oraz przykładowym kodem do wykonania w celu usuwania metadanych z programu Word w języku Python. Dowiesz się również, jaka jest różnica między usuwaniem właściwości niestandardowych a właściwościami wbudowanymi.
Kroki, aby usunąć metadane z dokumentu programu Word w Pythonie
- Ustaw IDE, aby używało Aspose.Words dla Pythona przez .NET do usuwania metadanych
- Załaduj plik DOC za pomocą obiektu klasy Document
- Uzyskaj dostęp do kolekcji właściwości niestandardowych za pomocą właściwości custom_document_properties
- Wywołaj metodę clear() w kolekcji, aby jednocześnie usunąć właściwości i wartości
- Uzyskaj dostęp do wbudowanej kolekcji właściwości przy użyciu właściwości Built_in_document_properties
- Wywołaj metodę clear() w kolekcji, aby wyczyścić tylko wartości
- Zapisz wynikowy plik Word
Wymienione kroki oferują systematyczne podejście do czyszczenia metadanych z dokumentu Word w Pythonie. Proces jest dość łatwy, ponieważ najpierw ładowany jest plik docelowy, a następnie uzyskiwany jest dostęp do niestandardowych i wbudowanych kolekcji właściwości. Obie kolekcje zawierają metodę clear(), której można użyć do usunięcia właściwości.
Kod do usuwania metadanych z dokumentu programu Word w Pythonie
import aspose.words as aw | |
import aspose.pydrawing as drawing | |
# Load the license | |
wordLic = aw.License() | |
wordLic.set_license("Aspose.Total.lic") | |
# Load the DOC file | |
doc = aw.Document("SampleProps.doc") | |
# Get the custom properties collection and clear them | |
custProps = doc.custom_document_properties | |
custProps.clear() | |
# Get the built-in properties collection and clear them | |
builtInProps = doc.built_in_document_properties | |
builtInProps.clear() | |
# Save the Word file | |
doc.save("Output.doc") | |
print ("Metadata removed from the Word file") |
Ten zwięzły kod ilustruje proces usuwania wszystkich właściwości dokumentu i informacji osobistych w Pythonie. Metoda custom_document_properties zawiera metodę clear() , która może usunąć właściwość i jej wartość, podczas gdy metoda clear() w kolekcji Built_in_document_properties czyści tylko wartości i nie usuwa samej właściwości. Po wyczyszczeniu właściwości możesz dalej manipulować plikiem wyjściowym, używając wielu właściwości w klasie Document przed zapisaniem pliku wyjściowego.
Ten kod nauczył nas, jak usuwać wszystkie właściwości dokumentów i dane osobowe w Pythonie. Jeśli chcesz usunąć komentarze z pliku Word, zapoznaj się z artykułem na jak usunąć komentarze w programie Word za pomocą Pythona.