Kaip konvertuoti PDF į tekstą Java

Šioje trumpoje pamokoje pateikiama išsami informacija apie tai, kaip konvertuoti PDF į tekstą Java įkeliant įvesties PDF dokumentą ir išsaugant jį Text formatu. Be to, naudojant Java PDF į tekstą konverterį galima tinkinti, kad būtų galima valdyti, ar norite išvesties tekstą su formatavimu ar be jo, palyginti su šaltinio PDF failu.

Veiksmai, kaip konvertuoti PDF į tekstą Java

  1. Sukonfigūruokite programą pridėdami nuorodą į Aspose.PDF iš Maven saugyklos, kad konvertuotumėte PDF į tekstinį failą
  2. Įkelkite įvesties PDF failą su Document klasės objektu, kad PDF konvertuotumėte į tekstinį failą
  3. Norėdami nustatyti teksto ištraukimo parinktis, sukurkite TextAbsorber klasės objektą
  4. Įrašykite ištrauktą tekstą į tekstinį failą

Aukščiau pateikti veiksmai paaiškina PDF į tekstą Java pagrįstos keitiklio programos kūrimo procesą. Pirmajame etape įvesties PDF dokumentas įkeliamas naudojant dokumentų klasės egzempliorių, tada pasirinkite, ar norite teksto su formatavimu, ar ne. Galiausiai galite naudoti teksto eilutę norėdami įrašyti į failą arba apdoroti jį toliau pagal savo poreikius.

Kodas konvertuoti PDF į tekstą Java

Šis pavyzdinis kodas parodo, kad naudojant Java konvertuoti PDF į tekstą su visišku valdymu, naudojant įvairias parinktis, pvz., TextAbsorber klasėje, yra keli konstruktoriai, kuriuose galite naudoti “TextSearchOptions”, kurios suteikia galimybę konvertuoti užtemdytą tekstą šaltinio PDF formatu kaip atskirą tekstą. Panašiai galite nustatyti vėliavėles, kad ieškotumėte teksto tik surištame puslapyje, arba nustatyti stačiakampį, kad teksto būtų ieškoma tik tam tikroje srityje visuose puslapiuose.

Čia mes sužinojome, kaip konvertuoti PDF į tekstą Java kartu su kodo fragmentu. Jei norite sužinoti, kaip konvertuoti PDF į Word formatą, žr. straipsnį Kaip konvertuoti PDF į Word Java.

 Latviski