Kako izdvojiti tekst iz skeniranog PDF-a u Javi

Ovaj kratki vodič pruža detalje o tome kako izdvojiti tekst iz skeniranog PDF-a u Javi. Možete konfigurirati ovaj proces izdvajanja teksta iz skeniranog PDF-a u Javi postavljanjem parametara detekcije. Također je dostupna opcija odabira između brzine ili točnosti ovisno o PDF kvaliteti i drugim zahtjevima aplikacije.

Koraci za izdvajanje teksta iz skeniranog PDF-a u Javi

  1. Iz repozitorija Maven konfigurirajte Aspose.OCR u svom projektu za čitanje skeniranog PDF teksta
  2. Inicijalizirajte objekt AsposeOcrPdf za čitanje teksta iz PDF-a
  3. Instancirajte objekt klase DocumentRecognitionSettings za postavljanje parametara prepoznavanja
  4. Postavite početnu stranicu i broj stranica u PDF-u za čitanje teksta
  5. Da biste povećali brzinu otkrivanja, postavite oznaku područja otkrivanja na lažno
  6. Pozovite funkciju RecognizePdf za čitanje cijelog teksta prema gornjoj konfiguraciji
  7. Iterirajte kroz sve izdvojene rezultate s PDF stranica i prikažite ih na konzoli

Tijekom procesa skeniranja teksta iz PDF-a u Javi, pokreće se objekt AsposeOCRPdf koji zapravo sadrži značajke za prepoznavanje teksta iz PDF-a. Podržava konfiguraciju procesa otkrivanja kao što je broj početne stranice, broj PDF stranica za čitanje i mogućnost postavljanja područja otkrivanja za kontrolu brzine i točnosti. Na kraju analiziramo zbirku rezultata skeniranih sa svake stranice i prikazujemo ih na konzoli.

Kod za pretvaranje skeniranog PDF-a u tekst u Javi

Ovaj kôd koristi AsposeOCRPdf za dobivanje teksta iz skeniranog PDF-a u Javi. Objekt klase DocumentRecognitionSettings sadrži opcije za postavljanje konfiguracije stranica pomoću konstruktora kao što je prikazano u ovom primjeru koda ili zasebnim postavljanjem početne stranice i broja stranice. Također možete postaviti jezik, korekcije iskrivljenja slike i broj niti za paralelno otkrivanje teksta iz skeniranog PDF-a.

U ovom smo članku naučili kako izdvojiti tekst iz skeniranog PDF-a u Javi zajedno s konfiguracijom procesa otkrivanja. Međutim, ako želite izvući tekst iz slike, pogledajte članak na kako izvući tekst iz slike pomoću Jave.

 Hrvatski