Այս կարճ դասընթացը ցույց է տալիս, թե ինչպես վերածել սկանավորված PDF-ը խմբագրելի PDF-ով Java-ի միջոցով. Այն ներառում է IDE-ի կարգավորման մանրամասները, քայլերի ցանկը և օրինակ կոդը սկանավորված PDF-ը փոխարկելու որոնելի PDF-ով Java-ի միջոցով. Դուք կստանաք մանրամասներ՝ պատկերների սկանավորման և բովանդակության ընթերցելի տեքստի փոխարկման գործընթացը հարմարեցնելու համար.
PDF-ները Java-ով ընթերցելի դարձնելու քայլերը
- Կարգավորեք IDE‑ը՝ օգտագործելով Aspose.Total for Java՝ սկանավորված PDF-ն փոխարկելու փնտրելի PDF
- Ստեղծեք համապատասխան արտադրանքի լիցենզիաները, որպեսզի ելքում չլինի ջրանշաններ
- Ստեղծեք ճանաչման շարժիչի օրինակ՝ օգտագործելով AsposeOCR դասը
- Ստեղծեք մուտքի օրինակ՝ օգտագործելով OcrInput դասը և բեռնեք սկզբնական սկանավորված PDF-ը
- Ստեղծեք RecognitionSettings օրինակ՝ պատկերների սկանավորման ընթացքում կարգավորումները սահմանելու համար
- AsposeOCR.Recognize() մեթոդը կանչել, որպեսզի ստանանք տվյալները սկանավորված PDF‑ից և պահպանենք դրանք ժամանակավոր PDF‑ում
- Բեռնել միջանկյալ PDF‑ը Aspose.PDF-ի Document դասի օբյեկտում և սահմանել դրա մետատվյալները
- Պահպանեք վերջնական PDF‑ը սկավառակի վրա, որոնելի տեքստով և մետադատներով
Այս քայլերը նկարագրում են, թե ինչպես փոխարկել PDF պատկերից PDF տեքստ Java-ի միջոցով։ Ստեղծեք ճանաչման շարժիչի օբյեկտը, պատրաստեք մուտքի ֆայլը՝ OcrInput օբյեկտում ավելացնելով սկանավորված PDF ֆայլը, սահմանեք պարամետրերը RecognitionSettings օբյեկտում, կանչեք Recognize() մեթոդը՝ տվյալները սկանավորելու և արդյունքները միջանկյալ PDF ֆայլում պահպանելու համար։ Վերջում, բեռնեք միջանկյալ PDF ֆայլը՝ Aspose.PDF.Document օբյեկտի միջոցով և ավելացրեք մետատվյալներ կամ ավելի ձևավորեք այն, նախքան վերջնական PDF ֆայլի պահպանումը։
Java-ով PDF պատկերից տեքստի փոխարկման կոդ
Այս կոդը ցույց է տալիս, թե ինչպես convert PDF to searchable PDF using Java։ Դուք կարող եք սահմանել հատուկ հայտնաբերման լեզու PDF-ը սկանավորելու ժամանակ, սահմանել դրոշակ՝ լեզուն ավտոմատ հայտնաբերելու համար, սահմանափակել ճանաչումը հատուկ նիշերով կամ սև ցուցակել այն նիշերը, որոնք ցանկանում եք, որ OCR-ը անտեսի։ Ընտրանքներ նույնպես հասանելի են՝ անհրաժեշտության դեպքում ընտրելու աղբյուրի փաստաթղթի տարածքի/դասավորության հայտնաբերման ռազմավարությունը։
Այս հոդվածը մեզ սովորեցրեց PDF- ը փոխարկելու գործընթացը ընտրելի տեքստային PDF-ի։ PDF ձևից տվյալները Excel‑ի արտահանել համար, դիմեք հոդվածին Export Data from a PDF Form to Excel using Java.