Այս կարճ ձեռնարկը մանրամասներ է տալիս այն մասին, թե ինչպես փոխակերպել PDF-ը տեքստի Java-ում՝ բեռնելով մուտքագրված PDF փաստաթուղթը և պահելով այն Text ձևաչափում: Ավելին, օգտագործելով Java PDF-ի տեքստ փոխարկիչը կարող է հարմարեցվել՝ վերահսկելու համար, եթե ցանկանում եք ելքային տեքստը ձևաչափով կամ առանց սկզբնաղբյուր PDF ֆայլի համեմատ:
Java-ում PDF-ը տեքստի փոխարկելու քայլեր
- Կազմաձևեք ձեր հավելվածը՝ ավելացնելով հղումը Aspose.PDF-ին Maven պահոցից՝ PDF-ը տեքստային ֆայլի փոխարկելու համար:
- Ներբեռնեք մուտքագրված PDF ֆայլը Document դասի օբյեկտով՝ PDF-ը տեքստային ֆայլի փոխակերպելու համար
- Ստեղծեք TextAbsorber դասի օբյեկտ՝ տեքստի արդյունահանման տարբերակները սահմանելու համար
- Գրեք արդյունահանված տեքստը Տեքստային ֆայլում
Վերոնշյալ քայլերը մշակում են PDF դեպի տեքստ Java փոխարկիչ հավելվածի մշակման գործընթացը: Առաջին քայլում մուտքագրված PDF փաստաթուղթը բեռնվում է Document դասի օրինակով, այնուհետև ընտրում եք՝ ցանկանում եք տեքստը ձևաչափով, թե ոչ: Վերջապես, դուք կարող եք օգտագործել տեքստային տողը ֆայլի մեջ գրելու կամ այն հետագա մշակելու համար՝ ըստ ձեր պահանջների:
Կոդ՝ PDF-ը Java-ում տեքստի փոխարկելու համար
Այս օրինակելի կոդը ցույց է տալիս, որ օգտագործելով Java-ը փոխակերպում է PDF-ը տեքստի լիակատար վերահսկողությամբ՝ օգտագործելով տարբեր ընտրանքներ, ինչպիսիք են TextAbsorber դասը, ունի բազմաթիվ կոնստրուկտորներ, որտեղ կարող եք օգտագործել TextSearchOptions-ը, որն ապահովում է ստվերավորված տեքստը աղբյուրի PDF-ում որպես առանձին տեքստ փոխարկելու հնարավորություն: Նմանապես, դուք կարող եք դրոշներ դնել, որպեսզի տեքստը որոնվի միայն էջի սահմաններում կամ ուղղանկյուն սահմանել՝ տեքստը նշված տարածքից միայն բոլոր էջերում որոնելու համար:
Այստեղ մենք սովորեցինք, թե ինչպես PDF-ը վերածել տեքստի Java-ում կոդի հատվածի հետ միասին: Եթե ցանկանում եք սովորել PDF-ը Word-ի փոխարկելու գործընթացը, տես ինչպես փոխարկել PDF-ը Word-ի Java-ում-ի հոդվածը: