स्कैन किए गए PDF को Java का उपयोग करके संपादन योग्य PDF में बदलें

यह संक्षिप्त ट्यूटोरियल बताता है कि स्कैन किए गए PDF को जावा का उपयोग करके संपादन योग्य PDF में कैसे बदलें। यह IDE को कॉन्फ़िगर करने के विवरण, चरणों की सूची, और जावा का उपयोग करके स्कैन किए गए PDF को खोज योग्य PDF में बदलने के लिए नमूना कोड शामिल करता है। आपको इमेज स्कैन करने और सामग्री को पढ़ने योग्य टेक्स्ट में बदलने की प्रक्रिया को अनुकूलित करने के विवरण मिलेंगे।

जावा का उपयोग करके PDF को पढ़ने योग्य बनाने के चरण

  1. IDE को Aspose.Total for Java का उपयोग करने के लिए सेट करें ताकि स्कैन किए गए PDF को खोज योग्य PDF में परिवर्तित किया जा सके
  2. आउटपुट में वॉटरमार्क से बचने के लिए संबंधित उत्पाद लाइसेंस को इंस्टैंशिएट करें
  3. AsposeOCR क्लास का उपयोग करके पहचान इंजन का एक उदाहरण बनाएं
  4. OcrInput क्लास का उपयोग करके इनपुट इंस्टेंस बनाएं और स्रोत स्कैन किया गया PDF इसमें लोड करें
  5. इमेज स्कैनिंग के दौरान कस्टमाइज़ेशन के लिए पैरामीटर सेट करने हेतु RecognitionSettings इंस्टेंस बनाएं
  6. AsposeOCR.Recognize() मेथड को कॉल करें ताकि स्कैन किए गए PDF से डेटा प्राप्त किया जा सके और उसे एक अस्थायी PDF में संग्रहीत किया जा सके।
  7. मध्यवर्ती PDF को Aspose.PDF के Document क्लास ऑब्जेक्ट में लोड करें और उसमें मेटाडेटा सेट करें।
  8. अंतिम PDF को डिस्क पर सर्चेबल टेक्स्ट और मेटाडेटा के साथ सहेजें

ये चरण वर्णन करते हैं कि Java का उपयोग करके PDF इमेज को PDF टेक्स्ट में कैसे बदलें। Recognition engine ऑब्जेक्ट बनाएं, स्कैन किए गए PDF फ़ाइल को OcrInput ऑब्जेक्ट में जोड़कर इनपुट फ़ाइल तैयार करें, RecognitionSettings ऑब्जेक्ट में पैरामीटर निर्धारित करें, डेटा स्कैन करने के लिए Recognize() मेथड को कॉल करें और परिणामों को एक मध्यवर्ती PDF फ़ाइल में सहेजें। अंत में, Aspose.PDF.Document ऑब्जेक्ट का उपयोग करके मध्यवर्ती PDF फ़ाइल लोड करें और अंतिम PDF फ़ाइल को सहेजने से पहले मेटाडेटा जोड़ें या इसे आगे फ़ॉर्मेट करें।

जावा का उपयोग करके PDF चित्र को टेक्स्ट में बदलने का कोड

यह कोड दिखाता है कि Java का उपयोग करके PDF को खोज योग्य PDF में कैसे बदलें। आप PDF को स्कैन करते समय एक विशिष्ट पहचान भाषा सेट कर सकते हैं, भाषा को स्वचालित रूप से पहचानने के लिए एक फ़्लैग सेट कर सकते हैं, पहचान को विशिष्ट अक्षरों तक सीमित कर सकते हैं या उन अक्षरों को ब्लैकलिस्ट कर सकते हैं जिन्हें OCR को अनदेखा करना चाहिए। यदि आवश्यक हो तो स्रोत दस्तावेज़ क्षेत्र/लेआउट पहचान रणनीति चुनने के विकल्प भी उपलब्ध हैं।

यह लेख हमें PDF को चयन योग्य टेक्स्ट PDF में बदलने की प्रक्रिया सिखाता है। PDF फ़ॉर्म से डेटा को Excel में निर्यात करने के लिए, लेख देखें जावा का उपयोग करके PDF फ़ॉर्म से Excel में डेटा निर्यात करें

 हिन्दी