Kako čitati PDF datoteku u Javi

Ovaj kratki vodič vas vodi o tome kako čitati PDF datoteku u Javi. Sadrži Java kod za čitanje PDF datoteke tako da prvo pročitate tekst iz PDF u Javi u niz i zatim dohvatite sve slike iz PDF datoteke da ih spremite na disk kao JPG. Nema potrebe za instaliranjem alata treće strane za čitanje PDF-a u Javi.

Koraci za čitanje PDF datoteke u Javi

  1. Konfigurirajte Aspose.PDF u svoj projekt koristeći Maven repozitorij za čitanje PDF datoteke
  2. Učitajte primjer PDF datoteke u objekt klase Document
  3. Instancirajte objekt klase TextAbsorber koji može čitati cijeli tekst iz PDF datoteke
  4. Pročitajte PDF tekst iz učitane datoteke pomoću objekta klase TextAbsorber
  5. Prikaži cijeli tekst pročitan iz PDF datoteke na konzoli
  6. Iterirajte kroz sve stranice u PDF datoteci za pristup slikama
  7. Raščlanite sve slike na svakoj zbirci slika stranica i spremite ih na disk

U ovom kratkom vodiču korak po korak prvo učitavamo ciljnu PDF datoteku, a zatim pokrećemo objekt klase TextAbsorber koji je sposoban pretraživati tekst kroz sve stranice u PDF-u. Cijeli ovaj tekst se vraća u niz koji se može prikazati ili obraditi prema zahtjevu. Slično tome, možemo raščlaniti sve slike u zbirci slika i spremiti ih na disk u bilo kojem formatu kao što smo ga spremili kao JPG u ovom vodiču.

Kod za čitanje PDF-a pomoću Jave

U ovom uzorku koda upotrijebili smo klasu TextAbsorber i getImages() funkciju Page.getResources() za čitanje PDF-a pomoću Jave. Objekt TextAbsorber koristi se za čitanje teksta pomoću funkcije prihvaćanja u PDF PageCollection. Dok funkcija getImages() kolekcije getResources() vraća sve slike na stranici.

Imajte na umu da se ovi koraci za čitanje PDF-a u Javi mogu izvesti u bilo kojem operativnom sustavu kao što su Windows, Linux ili macOS. Ako želite saznati više o radu s PDF datotekama, pogledajte članak na kako čitati knjižne oznake u PDF-u pomoću Jave.

 Hrvatski