Jak vyčistit metadata z PDF pomocí Pythonu

Tento krátký průvodce vysvětluje, jak vyčistit metadata z PDF pomocí Pythonu. Obsahuje podrobnosti pro nastavení vývojového prostředí, seznam programovacích úloh a spustitelný ukázkový kód pro odstranění metadat PDF pomocí Pythonu. Povede vás odstranit výchozí vlastnosti jednu po druhé a všechny uživatelské vlastnosti společně.

Kroky k odstranění metadat z PDF pomocí Pythonu

  1. Chcete-li metadata vyčistit, nastavte prostředí na použijte Aspose.PDF pro Python přes .NET
  2. Načtěte zdrojový soubor PDF pomocí třídy Document pro odstranění metadat
  3. V případě potřeby vytvořte a použijte funkci zobrazení metadat
  4. Získejte přístup k metadatům pomocí objektu třídy DocumentInfo
  5. Vymažte výchozí metadata pomocí metody remove().
  6. Smažte vlastní metadata
  7. Uložte výsledný soubor PDF

Tyto kroky shrnují proces vyčištění metadat z PDF pomocí Pythonu. Načtěte zdrojový soubor PDF do třídy Document a poté získejte přístup k metadatům pomocí DocumentInfo. Odeberte výchozí vlastnosti voláním metody remove() s názvem vlastnosti jako argumentem a voláním metody clear_custom_data() k odstranění všech uživatelských vlastností.

Kód pro odstranění metadat PDF pomocí Pythonu

import aspose.pdf as pdf
# Load License
license = pdf.License()
license.set_license("License.lic")
def DisplayMetadata(info):
print(f"title:{info.title}")
print(f"author:{info.author}")
try:
print(f"creation_date:{info.creation_date}")
except:
print("creation_date is empty")
print(f"creator:{info.creator}")
try:
print(f"mod_date:{info.mod_date}")
except:
print("mod_date is empty")
print(f"producer:{info.producer}")
print(f"subject:{info.subject}")
# Open document
pdfDocument = pdf.Document("Sample.pdf")
# Access the metadata
info = pdf.DocumentInfo(pdfDocument)
DisplayMetadata(info)
# Clear the default metadata
info.remove("Title")

Tento kód ukazuje, jak vymazat metadata z PDF pomocí Pythonu. K případnému zobrazení metadat před a po odstranění jsme použili metodu DisplayMetadata(). Metoda DocumentInfo.remove() vyžaduje výchozí název vlastnosti, zatímco metoda clear_custom_data() nevyžaduje žádný argument pro odstranění uživatelských vlastností.

V tomto článku jsme se naučili proces vývoje PDF nástroje pro odstranění metadat pomocí Pythonu. Pokud chcete odstranit různá omezení u souboru PDF, přečtěte si článek na jak odstranit omezení pro dokument PDF v Pythonu.

 Čeština