Kako čitati PDF metapodatke pomoću Pythona

Ovaj kratki vodič objašnjava kako čitati PDF metapodatke pomoću Pythona. Sadrži detaljne informacije za postavljanje okruženja za razvoj aplikacije, postupak u koracima i primjer koda koji se može izvoditi za izdvajanje metapodataka iz PDF-a pomoću Pythona. Naučit ćete kako je jednostavno napisati aplikaciju i pristupiti informacijama o metapodacima iz PDF koristeći vrlo malo API poziva bez instaliranja alata treće strane u bilo kojem okruženju koje podržava Python.

Koraci za čitanje PDF metapodataka pomoću Pythona

  1. Uspostavite okruženje za koristite Aspose.PDF za Python putem .NET-a za čitanje metapodataka
  2. Učitajte izvornu PDF datoteku pomoću objekta klase Document za dohvaćanje metapodataka
  3. Pristupite objektu klase DocumentInfo koji sadrži PDF metapodatke
  4. Pristupite nekim svojstvima informacija i prikažite ih na konzoli

Ovi koraci opisuju postupak za pregled PDF metapodataka pomoću Pythona. Najprije trebate učitati ciljnu PDF datoteku, a zatim pristupiti svojstvu DocumentInfo pod nazivom ‘Info’ u klasi Document. Ovaj objekt ima sve metapodatke u PDF-u poput kreatora, vremenske zone izmjene, proizvođača, datuma stvaranja i datuma izmjene.

Kod za dobivanje PDF metapodataka pomoću Pythona

Ovaj kod jednostavno demonstrira postupak dohvaćanja PDF metapodataka pomoću Pythona. Objektu klase DocumentInfo pristupa se iz učitanog dokumenta koji ima brojne informacije o metapodacima kao što su zarobljena oznaka, naslov, predmet, ključne riječi dokumenta i autor. Ako želite dodati ova svojstva, možete koristiti metodu DocumentInfo.add(), metodu clear() za brisanje metapodataka i metodu remove() za uklanjanje samo navedenih metapodataka.

Ovaj članak opisuje postupak dohvaćanja metapodataka iz PDF-a. Ako želite naučiti postupak čitanja PDF sadržaja, pogledajte članak na kako čitati PDF sadržaj u Pythonu.

 Hrvatski