Konvertuoti nuskenuotą PDF į redaguojamą PDF naudojant Java

Ši trumpa pamoka supažindina, kaip konvertuoti nuskenuotą PDF į redaguojamą PDF naudojant Java. Joje pateikiama informacija apie IDE konfigūravimą, žingsnių sąrašas ir pavyzdinis kodas, kaip konvertuoti nuskenuotą PDF į ieškomą PDF naudojant Java. Gausite išsamias instrukcijas, kaip pritaikyti skenavimo vaizdo procesą ir konvertuoti turinį į skaitomą tekstą.

Žingsniai, kaip padaryti PDF skaitomą naudojant Java

  1. Nustatykite IDE naudoti Aspose.Total for Java, kad paverstumėte nuskenuotą PDF į ieškomą PDF
  2. Sukurkite atitinkamas produkto licencijas, kad išvengtumėte vandens žymių išvestyje.
  3. Sukurkite atpažinimo variklio egzempliorių naudodami AsposeOCR klasę
  4. Sukurkite įvesties egzempliorių naudodami OcrInput klasę ir įkelkite šaltinio nuskenuotą PDF į ją.
  5. Sukurkite RecognitionSettings egzempliorių, kad nustatytumėte parametrus, skirtus pritaikymui vaizdo nuskaitymo metu
  6. Iškvieskite AsposeOCR.Naudokite Recognize() metodą, kad gautumėte duomenis iš nuskenuoto PDF ir įrašytumėte juos į laikiną PDF.
  7. Įkelkite tarpinį PDF į Document klasės objektą Aspose.PDF ir nustatykite jo metaduomenis
  8. Išsaugokite galutinį PDF diske su ieškoma tekstu ir metaduomenimis

Šie veiksmai aprašo, kaip konvertuoti PDF vaizdus į PDF tekstą naudojant Java. Sukurkite atpažinimo variklio objektą, paruoškite įvesties failą pridėdami nuskenuotą PDF failą prie OcrInput objekto, apibrėžkite parametrus RecognitionSettings objekte, iškvieskite Recognize() metodą, kad nuskaitytumėte duomenis ir įrašytumėte rezultatus į tarpinį PDF failą. Galiausiai įkelkite tarpinį PDF failą naudodami Aspose.PDF.Dokumentuokite objektą ir pridėkite metaduomenis arba formatuokite jį toliau prieš išsaugodami galutinį PDF failą.

Kodas PDF paveikslėlio konvertavimui į tekstą naudojant Java

Šis kodas demonstruoja, kaip konvertuoti PDF į ieškomą PDF naudojant Java. Galite nustatyti konkrečią aptikimo kalbą skenuojant PDF, nustatyti vėliavą automatinam kalbos aptikimui, apriboti atpažinimą iki konkrečių simbolių arba įtraukti į juodąjį sąrašą simbolius, kuriuos norite, kad OCR ignoruotų. Taip pat yra galimų parinkčių pasirinkti šaltinio dokumento srities / išdėstymo aptikimo strategiją, jei reikia.

Šiame straipsnyje buvo paaiškintas procesas, kaip konvertuoti PDF į pasirenkamą tekstinį PDF. Norėdami eksportuoti duomenis iš PDF formos į Excel, žiūrėkite straipsnį Eksportuoti duomenis iš PDF formos į Excel naudojant Java.

 Latviski