जावा में स्कैन किए गए पीडीएफ से टेक्स्ट कैसे निकालें

यह त्वरित ट्यूटोरियल इस बारे में विवरण प्रदान करता है कि जावा में स्कैन किए गए पीडीएफ से टेक्स्ट कैसे निकाला जाए। आप डिटेक्शन पैरामीटर सेट करके जावा में स्कैन किए गए पीडीएफ से टेक्स्ट निकालने की इस प्रक्रिया को कॉन्फ़िगर कर सकते हैं। PDF गुणवत्ता और अन्य एप्लिकेशन आवश्यकताओं के आधार पर गति या सटीकता के बीच चयन करने का विकल्प भी उपलब्ध है।

जावा में स्कैन की गई पीडीएफ से टेक्स्ट निकालने के चरण

  1. मावेन रिपॉजिटरी से, स्कैन किए गए पीडीएफ टेक्स्ट को पढ़ने के लिए अपने प्रोजेक्ट में Aspose.OCR कॉन्फ़िगर करें
  2. पीडीएफ से टेक्स्ट पढ़ने के लिए AsposeOcrPdf ऑब्जेक्ट को इनिशियलाइज़ करें
  3. पहचान पैरामीटर सेट करने के लिए DocumentRecognitionSettings क्लास ऑब्जेक्ट को इंस्टेंट करें
  4. पाठ पढ़ने के लिए पीडीएफ में प्रारंभ पृष्ठ और पृष्ठों की संख्या सेट करें
  5. पता लगाने की गति बढ़ाने के लिए, पता लगाने वाले क्षेत्रों के ध्वज को गलत पर सेट करें
  6. उपरोक्त कॉन्फ़िगरेशन के अनुसार सभी पाठ पढ़ने के लिए पहचान पत्र फ़ंक्शन को कॉल करें
  7. पीडीएफ पृष्ठों से निकाले गए सभी परिणामों के माध्यम से पुनरावृति करें और उन्हें कंसोल पर प्रदर्शित करें
  • जावा में पीडीएफ से टेक्स्ट को स्कैन करने की प्रक्रिया के दौरान, AsposeOCRPdf का एक ऑब्जेक्ट शुरू किया जाता है जिसमें वास्तव में पीडीएफ से टेक्स्ट को पहचानने की विशेषताएं होती हैं। यह प्रारंभ पृष्ठ संख्या, पढ़ने के लिए पीडीएफ पृष्ठों की संख्या, और गति और सटीकता को नियंत्रित करने के लिए पता लगाने के क्षेत्रों को सेट करने के विकल्प जैसी पहचान प्रक्रिया को कॉन्फ़िगर करने का समर्थन करता है। अंत में, हम प्रत्येक पृष्ठ से स्कैन किए गए परिणाम संग्रह के माध्यम से विश्लेषण करते हैं और उन्हें कंसोल पर प्रदर्शित करते हैं।

जावा में स्कैन किए गए पीडीएफ को टेक्स्ट में बदलने के लिए कोड

यह कोड जावा में स्कैन की गई पीडीएफ से टेक्स्ट प्राप्त करने के लिए AsposeOCRPdf का उपयोग करता है। DocumentRecognitionSettings क्लास ऑब्जेक्ट में पेज कॉन्फ़िगरेशन सेट करने के विकल्प होते हैं या तो इस नमूना कोड में प्रदर्शित कंस्ट्रक्टर का उपयोग करके या StartPage और PagesNumber को अलग-अलग सेट करके। आप स्कैन किए गए PDF से टेक्स्ट के समानांतर पता लगाने के लिए भाषा, छवि तिरछा सुधार और थ्रेड काउंट भी सेट कर सकते हैं।

इस लेख में, हमने सीखा है कि जावा में स्कैन किए गए पीडीएफ से टेक्स्ट कैसे निकाला जाता है और साथ ही डिटेक्शन प्रोसेस का कॉन्फिगरेशन कैसे किया जाता है। हालांकि, यदि आप किसी छवि से टेक्स्ट निकालना चाहते हैं, तो जावा का उपयोग करके छवि से टेक्स्ट कैसे निकालें पर लेख देखें।

 हिन्दी