Ovaj kratki vodič pruža detalje o tome kako izdvojiti tekst iz skeniranog PDF-a u Javi. Možete konfigurirati ovaj proces izdvajanja teksta iz skeniranog PDF-a u Javi postavljanjem parametara detekcije. Također je dostupna opcija odabira između brzine ili točnosti ovisno o PDF kvaliteti i drugim zahtjevima aplikacije.

Koraci za izdvajanje teksta iz skeniranog PDF-a u Javi

Iz repozitorija Maven konfigurirajte Aspose.OCR u svom projektu za čitanje skeniranog PDF teksta
Inicijalizirajte objekt AsposeOcrPdf za čitanje teksta iz PDF-a
Instancirajte objekt klase DocumentRecognitionSettings za postavljanje parametara prepoznavanja
Postavite početnu stranicu i broj stranica u PDF-u za čitanje teksta
Da biste povećali brzinu otkrivanja, postavite oznaku područja otkrivanja na lažno
Pozovite funkciju RecognizePdf za čitanje cijelog teksta prema gornjoj konfiguraciji
Iterirajte kroz sve izdvojene rezultate s PDF stranica i prikažite ih na konzoli

Tijekom procesa skeniranja teksta iz PDF-a u Javi, pokreće se objekt AsposeOCRPdf koji zapravo sadrži značajke za prepoznavanje teksta iz PDF-a. Podržava konfiguraciju procesa otkrivanja kao što je broj početne stranice, broj PDF stranica za čitanje i mogućnost postavljanja područja otkrivanja za kontrolu brzine i točnosti. Na kraju analiziramo zbirku rezultata skeniranih sa svake stranice i prikazujemo ih na konzoli.

Kod za pretvaranje skeniranog PDF-a u tekst u Javi

Ovaj kôd koristi AsposeOCRPdf za dobivanje teksta iz skeniranog PDF-a u Javi. Objekt klase DocumentRecognitionSettings sadrži opcije za postavljanje konfiguracije stranica pomoću konstruktora kao što je prikazano u ovom primjeru koda ili zasebnim postavljanjem početne stranice i broja stranice. Također možete postaviti jezik, korekcije iskrivljenja slike i broj niti za paralelno otkrivanje teksta iz skeniranog PDF-a.

U ovom smo članku naučili kako izdvojiti tekst iz skeniranog PDF-a u Javi zajedno s konfiguracijom procesa otkrivanja. Međutim, ako želite izvući tekst iz slike, pogledajte članak na kako izvući tekst iz slike pomoću Jave.

Aspose Baza znanja

Pronađite odgovore pomoću API-ja

Kako izdvojiti tekst iz skeniranog PDF-a u Javi

Koraci za izdvajanje teksta iz skeniranog PDF-a u Javi

Kod za pretvaranje skeniranog PDF-a u tekst u Javi