Ovaj kratki vodič vas vodi o tome kako čitati PDF datoteku u Javi. Sadrži Java kod za čitanje PDF datoteke tako da prvo pročitate tekst iz PDF u Javi u niz i zatim dohvatite sve slike iz PDF datoteke da ih spremite na disk kao JPG. Nema potrebe za instaliranjem alata treće strane za čitanje PDF-a u Javi.
Koraci za čitanje PDF datoteke u Javi
- Konfigurirajte Aspose.PDF u svoj projekt koristeći Maven repozitorij za čitanje PDF datoteke
- Učitajte primjer PDF datoteke u objekt klase Document
- Instancirajte objekt klase TextAbsorber koji može čitati cijeli tekst iz PDF datoteke
- Pročitajte PDF tekst iz učitane datoteke pomoću objekta klase TextAbsorber
- Prikaži cijeli tekst pročitan iz PDF datoteke na konzoli
- Iterirajte kroz sve stranice u PDF datoteci za pristup slikama
- Raščlanite sve slike na svakoj zbirci slika stranica i spremite ih na disk
U ovom kratkom vodiču korak po korak prvo učitavamo ciljnu PDF datoteku, a zatim pokrećemo objekt klase TextAbsorber koji je sposoban pretraživati tekst kroz sve stranice u PDF-u. Cijeli ovaj tekst se vraća u niz koji se može prikazati ili obraditi prema zahtjevu. Slično tome, možemo raščlaniti sve slike u zbirci slika i spremiti ih na disk u bilo kojem formatu kao što smo ga spremili kao JPG u ovom vodiču.
Kod za čitanje PDF-a pomoću Jave
U ovom uzorku koda upotrijebili smo klasu TextAbsorber i getImages() funkciju Page.getResources() za čitanje PDF-a pomoću Jave. Objekt TextAbsorber koristi se za čitanje teksta pomoću funkcije prihvaćanja u PDF PageCollection. Dok funkcija getImages() kolekcije getResources() vraća sve slike na stranici.
Imajte na umu da se ovi koraci za čitanje PDF-a u Javi mogu izvesti u bilo kojem operativnom sustavu kao što su Windows, Linux ili macOS. Ako želite saznati više o radu s PDF datotekama, pogledajte članak na kako čitati knjižne oznake u PDF-u pomoću Jave.