Ten krótki przewodnik wyjaśnia jak wyczyścić metadane z PDF za pomocą Pythona. Zawiera szczegółowe informacje dotyczące ustawiania środowiska programistycznego, listę zadań programistycznych i możliwy do uruchomienia przykładowy kod do usuwania metadanych PDF przy użyciu języka Python. Poprowadzi Cię do usuwania właściwości domyślnych pojedynczo i wszystkich właściwości niestandardowych łącznie.
Kroki, aby usunąć metadane z pliku PDF za pomocą języka Python
- Ustaw środowisko na użyj Aspose.PDF dla Pythona za pośrednictwem .NET, aby wyczyścić metadane
- Załaduj źródłowy plik PDF, korzystając z klasy Document w celu usunięcia metadanych
- W razie potrzeby utwórz i użyj funkcji wyświetlania metadanych
- Uzyskaj dostęp do metadanych za pomocą obiektu klasy DocumentInfo
- Wyczyść domyślne metadane za pomocą metody usuwania().
- Usuń niestandardowe metadane
- Zapisz wynikowy plik PDF
Poniższe kroki podsumowują proces czyszczenia metadanych z pliku PDF przy użyciu języka Python. Załaduj źródłowy plik PDF do klasy Document, a następnie uzyskaj dostęp do metadanych za pomocą metody DocumentInfo. Usuń właściwości domyślne, wywołując metodę usuwania() z nazwą właściwości jako argumentem i wywołując metodę clear_custom_data() w celu usunięcia wszystkich właściwości niestandardowych.
Kod do usuwania metadanych PDF przy użyciu języka Python
import aspose.pdf as pdf | |
# Load License | |
license = pdf.License() | |
license.set_license("License.lic") | |
def DisplayMetadata(info): | |
print(f"title:{info.title}") | |
print(f"author:{info.author}") | |
try: | |
print(f"creation_date:{info.creation_date}") | |
except: | |
print("creation_date is empty") | |
print(f"creator:{info.creator}") | |
try: | |
print(f"mod_date:{info.mod_date}") | |
except: | |
print("mod_date is empty") | |
print(f"producer:{info.producer}") | |
print(f"subject:{info.subject}") | |
# Open document | |
pdfDocument = pdf.Document("Sample.pdf") | |
# Access the metadata | |
info = pdf.DocumentInfo(pdfDocument) | |
DisplayMetadata(info) | |
# Clear the default metadata | |
info.remove("Title") |
Ten kod demonstruje, jak usunąć metadane z pliku PDF przy użyciu języka Python. Użyliśmy metody DisplayMetadata(), aby opcjonalnie wyświetlić metadane przed i po usunięciu. Metoda DocumentInfo.remove() wymaga domyślnej nazwy właściwości, natomiast metoda clear_custom_data() nie wymaga żadnego argumentu do usunięcia właściwości niestandardowych.
W tym artykule poznaliśmy proces tworzenia narzędzia do usuwania metadanych w formacie PDF przy użyciu języka Python. Jeśli chcesz usunąć różne ograniczenia dotyczące pliku PDF, zapoznaj się z artykułem na temat jak usunąć ograniczenia dotyczące dokumentu PDF w Pythonie.