Ovaj kratki tutorial pokazuje vam kako pretvoriti skenirani PDF u uređivi PDF pomoću Jave. Uključuje detalje za konfiguriranje IDE-a, popis koraka i uzorak koda za pretvaranje skeniranog PDF-a u pretraživi PDF pomoću Jave. Dobit ćete detalje za prilagodbu procesa skeniranja slike i pretvaranja sadržaja u čitljiv tekst.
Koraci za učiniti PDF čitljivim pomoću Jave
- Postavite IDE da koristi Aspose.Total for Java za pretvaranje skeniranog PDF-a u pretraživi PDF
- Instancirajte odgovarajuće licence proizvoda kako biste izbjegli vodene žigove u izlazu
- Stvorite instancu motora za prepoznavanje koristeći klasu AsposeOCR
- Stvorite instancu ulaza koristeći klasu OcrInput i učitajte izvorni skenirani PDF u nju.
- Stvorite instancu RecognitionSettings za postavljanje parametara prilagodbe tijekom skeniranja slike
- Pozovite metodu AsposeOCR.Pozovite Recognize() da dohvatite podatke iz skeniranog PDF‑a i pohranite ih u privremeni PDF.
- Učitajte međuprostorni PDF u objekt klase Document Aspose.PDF i postavite metapodatke u njega
- Spremi konačni PDF na disk s pretraživim tekstom i metapodacima
Ovi koraci opisuju kako pretvoriti PDF sliku u PDF tekst pomoću Jave. Stvorite objekt motora za prepoznavanje, pripremite ulaznu datoteku dodavanjem skenirane PDF datoteke u OcrInput objekt, definirajte parametre u RecognitionSettings objektu, pozovite metodu Recognize() za skeniranje podataka i spremite rezultate u međufajl PDF. Na kraju, učitajte međufajl PDF koristeći Aspose.PDF.Objekt dokumenta i dodajte metapodatke ili ga dodatno formatirajte prije spremanja konačne PDF datoteke.
Kod za pretvaranje PDF slike u tekst pomoću Jave.
Ovaj kod demonstrira kako pretvoriti PDF u pretraživi PDF koristeći Javu. Možete postaviti određeni jezik za detekciju prilikom skeniranja PDF-a, postaviti zastavicu za automatsko otkrivanje jezika, ograničiti prepoznavanje na određene znakove ili staviti na crnu listu znakove koje želite da OCR ignorira. Također su dostupne opcije za odabir strategije detekcije područja/rasporeda izvornog dokumenta ako je potrebno.
Ovaj članak nas je poučio procesu pretvaranja PDF‑a u PDF s odabirnim tekstom. Za izvoz podataka iz PDF obrasca u Excel, pogledajte članak Izvoz podataka iz PDF obrasca u Excel pomoću Jave.