Ovaj kratki vodič pruža detalje o tome kako konvertirati PDF u tekst u Javi učitavanjem ulaznog PDF dokumenta i njegovim spremanjem u Text format. Štoviše, korištenje Java PDF pretvarača u tekst može se prilagoditi za kontrolu želite li izlazni tekst sa ili bez oblikovanja u usporedbi s izvornom PDF datotekom.
Koraci za pretvaranje PDF-a u tekst u Javi
- Konfigurirajte svoju aplikaciju dodavanjem reference na Aspose.PDF iz repozitorija Maven za pretvaranje PDF-a u tekstualnu datoteku
- Učitajte ulaznu PDF datoteku s objektom klase Document za konverziju PDF-a u tekstualnu datoteku
- Napravite objekt klase TextAbsorber da postavite opcije izdvajanja teksta
- Zapišite izdvojeni tekst u tekstualnu datoteku
Gornji koraci razrađuju proces razvoja aplikacije za pretvaranje PDF-a u tekstualnu Javu. U prvom koraku učitava se ulazni PDF dokument pomoću instance klase Document, a zatim odabirete želite li tekst s formatiranjem ili ne. Konačno, možete koristiti tekstualni niz za pisanje u datoteku ili je dalje obraditi prema vašim zahtjevima.
Kod za pretvaranje PDF-a u tekst u Javi
Ovaj primjer koda pokazuje da korištenje Jave pretvara PDF u tekst uz potpunu kontrolu korištenjem različitih opcija kao što je klasa TextAbsorber ima višestruke konstruktore u kojima možete koristiti TextSearchOptions koji pruža opciju pretvaranja osjenčanog teksta u izvornom PDF-u kao zasebnog teksta. Slično, možete postaviti zastavice za pretraživanje teksta samo unutar omeđene stranice ili postaviti pravokutnik za pretraživanje teksta iz određenog područja samo na svim stranicama.
Ovdje smo naučili kako pretvoriti PDF u tekst u Javi zajedno s isječkom koda. Ako želite naučiti postupak pretvaranja PDF-a u Word, pogledajte članak na kako pretvoriti PDF u Word u Javi.