Tento krátký průvodce vysvětluje, jak vyčistit metadata z PDF pomocí Pythonu. Obsahuje podrobnosti pro nastavení vývojového prostředí, seznam programovacích úloh a spustitelný ukázkový kód pro odstranění metadat PDF pomocí Pythonu. Povede vás odstranit výchozí vlastnosti jednu po druhé a všechny uživatelské vlastnosti společně.
Kroky k odstranění metadat z PDF pomocí Pythonu
- Chcete-li metadata vyčistit, nastavte prostředí na použijte Aspose.PDF pro Python přes .NET
- Načtěte zdrojový soubor PDF pomocí třídy Document pro odstranění metadat
- V případě potřeby vytvořte a použijte funkci zobrazení metadat
- Získejte přístup k metadatům pomocí objektu třídy DocumentInfo
- Vymažte výchozí metadata pomocí metody remove().
- Smažte vlastní metadata
- Uložte výsledný soubor PDF
Tyto kroky shrnují proces vyčištění metadat z PDF pomocí Pythonu. Načtěte zdrojový soubor PDF do třídy Document a poté získejte přístup k metadatům pomocí DocumentInfo. Odeberte výchozí vlastnosti voláním metody remove() s názvem vlastnosti jako argumentem a voláním metody clear_custom_data() k odstranění všech uživatelských vlastností.
Kód pro odstranění metadat PDF pomocí Pythonu
import aspose.pdf as pdf | |
# Load License | |
license = pdf.License() | |
license.set_license("License.lic") | |
def DisplayMetadata(info): | |
print(f"title:{info.title}") | |
print(f"author:{info.author}") | |
try: | |
print(f"creation_date:{info.creation_date}") | |
except: | |
print("creation_date is empty") | |
print(f"creator:{info.creator}") | |
try: | |
print(f"mod_date:{info.mod_date}") | |
except: | |
print("mod_date is empty") | |
print(f"producer:{info.producer}") | |
print(f"subject:{info.subject}") | |
# Open document | |
pdfDocument = pdf.Document("Sample.pdf") | |
# Access the metadata | |
info = pdf.DocumentInfo(pdfDocument) | |
DisplayMetadata(info) | |
# Clear the default metadata | |
info.remove("Title") |
Tento kód ukazuje, jak vymazat metadata z PDF pomocí Pythonu. K případnému zobrazení metadat před a po odstranění jsme použili metodu DisplayMetadata(). Metoda DocumentInfo.remove() vyžaduje výchozí název vlastnosti, zatímco metoda clear_custom_data() nevyžaduje žádný argument pro odstranění uživatelských vlastností.
V tomto článku jsme se naučili proces vývoje PDF nástroje pro odstranění metadat pomocí Pythonu. Pokud chcete odstranit různá omezení u souboru PDF, přečtěte si článek na jak odstranit omezení pro dokument PDF v Pythonu.