Ինչպես կարդալ PDF ֆայլը Java-ում

Այս հակիրճ ձեռնարկը ձեզ ուղղորդում է ինչպես կարդալ PDF ֆայլը Java-ում: Այն պարունակում է Java կոդ PDF ֆայլը կարդալու համար այնպես, որ սկզբում դուք կարդում եք տեքստը PDF-ից Java-ից տողի մեջ, այնուհետև վերցնում եք բոլոր պատկերները PDF ֆայլից` դրանք սկավառակի վրա պահելու համար որպես JPG. Կարիք չկա տեղադրել որևէ երրորդ կողմի գործիք՝ Java-ում PDF կարդալու համար*:

Java-ում PDF ֆայլը կարդալու քայլեր

  1. Կազմաձևեք Aspose.PDF-ը ձեր նախագծում՝ օգտագործելով Maven պահոցը՝ PDF ֆայլը կարդալու համար
  2. Ներբեռնեք PDF ֆայլի նմուշը Document դասի օբյեկտում
  3. Ստեղծեք TextAbsorber դասի օբյեկտ, որը կարող է կարդալ ամբողջ տեքստը PDF ֆայլից
  4. Կարդացեք PDF տեքստը բեռնված ֆայլից՝ օգտագործելով TextAbsorber դասի օբյեկտը
  5. Ցուցադրել ամբողջ տեքստը, որը կարդացվել է PDF ֆայլից վահանակի վրա
  6. Կրկնեք PDF ֆայլի բոլոր էջերը՝ պատկերները մուտք գործելու համար
  7. Վերլուծեք յուրաքանչյուր էջի պատկերների հավաքածուի բոլոր պատկերները և պահեք դրանք սկավառակի վրա

Այս արագ քայլ առ քայլ ձեռնարկում մենք նախ բեռնում ենք թիրախային PDF ֆայլը, այնուհետև սկսում ենք TextAbsorber դասի օբյեկտը, որն ի վիճակի է փնտրել տեքստ PDF-ի բոլոր էջերում: Այս ամբողջ տեքստը վերադարձվում է տողի մեջ, որը կարող է ցուցադրվել կամ մշակվել ըստ պահանջի: Նմանապես, մենք կարող ենք վերլուծել պատկերների հավաքածուի բոլոր պատկերները և պահել դրանք սկավառակի վրա ցանկացած ձևաչափով, ինչպես որ մենք այն պահել ենք որպես JPG այս ձեռնարկում:

Կոդ՝ Java-ի միջոցով PDF կարդալու համար

Այս օրինակելի կոդում մենք օգտագործեցինք Page.getResources()-ի TextAbsorber դասը և getImages() ֆունկցիան՝ Java-ի միջոցով * PDF կարդալու համար: TextAbsorber օբյեկտը օգտագործվում է PDF PageCollection-ում ընդունող ֆունկցիայի տեքստը կարդալու համար: Մինչդեռ getImages() ֆունկցիան getResources() հավաքածուի վերադարձնում է էջի բոլոր պատկերները։

Նկատի ունեցեք, որ Java-ում PDF-ը կարդալու այս քայլերը կարող են իրականացվել ցանկացած օպերացիոն համակարգում, ինչպիսիք են Windows-ը, Linux-ը կամ macOS-ը: Եթե ցանկանում եք ավելին իմանալ PDF ֆայլերի հետ աշխատելու մասին, տես ինչպես կարդալ էջանիշերը PDF-ում Java-ի միջոցով-ի հոդվածը:

 Հայերեն