هذا الدليل القصير يوضح كيفية تحويل PDF الممسوحة ضوئياً إلى PDF قابل للتحرير باستخدام Java. يتضمن تفاصيل لتكوين IDE، قائمة بالخطوات، وعينة من الشيفرة لـ تحويل PDF الممسوح ضوئياً إلى PDF قابل للبحث باستخدام Java. ستحصل على تفاصيل لتخصيص عملية مسح الصورة وتحويل المحتوى إلى نص قابل للقراءة.
خطوات لجعل PDF قابل للقراءة باستخدام Java
- قم بتعيين IDE لاستخدام Aspose.Total for Java لتحويل ملف PDF ممسوح ضوئياً إلى ملف PDF قابل للبحث
- إنشاء تراخيص المنتج المناسبة لتجنب العلامات المائية في المخرجات
- إنشاء كائن من محرك التعرف باستخدام الفئة AsposeOCR
- إنشاء كائن الإدخال باستخدام الفئة OcrInput وتحميل ملف PDF الممسوح المصدر إليه
- أنشئ مثيل RecognitionSettings لتعيين المعلمات للتخصيص أثناء فحص الصورة
- استدعِ طريقة AsposeOCR.Recognize() لجلب البيانات من ملف PDF الممسوح وتخزينها في PDF مؤقت
- حمّل ملف PDF الوسيط إلى كائن الفئة Document في Aspose.PDF وقم بتعيين البيانات الوصفية فيه
- احفظ ملف PDF النهائي على القرص مع نص قابل للبحث والبيانات الوصفية
تصف هذه الخطوات كيفية تحويل تحويل صورة PDF إلى نص PDF باستخدام Java. أنشئ كائن محرك التعرف، حضّر ملف الإدخال بإضافة ملف PDF الممسوح ضوئياً إلى كائن OcrInput، عرّف المعلمات في كائن RecognitionSettings، استدعِ طريقة Recognize() لمسح البيانات وحفظ النتائج في ملف PDF وسيط. أخيراً، حمّل ملف PDF الوسيط باستخدام كائن Aspose.PDF.Document وأضف البيانات الوصفية أو قم بتنسيقه أكثر قبل حفظ ملف PDF النهائي.
كود لتحويل صورة PDF إلى نص باستخدام Java
يوضح هذا الكود كيفية تحويل PDF إلى PDF قابل للبحث باستخدام Java. يمكنك تعيين لغة كشف محددة أثناء مسح PDF، وتعيين علامة لاكتشاف اللغة تلقائيًا، وتقييد التعرف على أحرف معينة أو حظر الأحرف التي تريد أن يتجاهلها OCR. تتوفر أيضًا خيارات لاختيار استراتيجية كشف مساحة/تخطيط المستند المصدر إذا لزم الأمر.
لقد علمنا هذا المقال العملية لتحويل PDF إلى PDF نصي قابل للتحديد. لتصدير البيانات من نموذج PDF إلى Excel، راجع المقال تصدير البيانات من نموذج PDF إلى Excel باستخدام Java.