هذا الدليل القصير يوضح كيفية تحويل PDF الممسوحة ضوئياً إلى PDF قابل للتحرير باستخدام Java. يتضمن تفاصيل لتكوين IDE، قائمة بالخطوات، وعينة من الشيفرة لـ تحويل PDF الممسوح ضوئياً إلى PDF قابل للبحث باستخدام Java. ستحصل على تفاصيل لتخصيص عملية مسح الصورة وتحويل المحتوى إلى نص قابل للقراءة.

خطوات لجعل PDF قابل للقراءة باستخدام Java

قم بتعيين IDE لاستخدام Aspose.Total for Java لتحويل ملف PDF ممسوح ضوئياً إلى ملف PDF قابل للبحث
إنشاء تراخيص المنتج المناسبة لتجنب العلامات المائية في المخرجات
إنشاء كائن من محرك التعرف باستخدام الفئة AsposeOCR
إنشاء كائن الإدخال باستخدام الفئة OcrInput وتحميل ملف PDF الممسوح المصدر إليه
أنشئ مثيل RecognitionSettings لتعيين المعلمات للتخصيص أثناء فحص الصورة
استدعِ طريقة AsposeOCR.Recognize() لجلب البيانات من ملف PDF الممسوح وتخزينها في PDF مؤقت
حمّل ملف PDF الوسيط إلى كائن الفئة Document في Aspose.PDF وقم بتعيين البيانات الوصفية فيه
احفظ ملف PDF النهائي على القرص مع نص قابل للبحث والبيانات الوصفية

تصف هذه الخطوات كيفية تحويل تحويل صورة PDF إلى نص PDF باستخدام Java. أنشئ كائن محرك التعرف، حضّر ملف الإدخال بإضافة ملف PDF الممسوح ضوئياً إلى كائن OcrInput، عرّف المعلمات في كائن RecognitionSettings، استدعِ طريقة Recognize() لمسح البيانات وحفظ النتائج في ملف PDF وسيط. أخيراً، حمّل ملف PDF الوسيط باستخدام كائن Aspose.PDF.Document وأضف البيانات الوصفية أو قم بتنسيقه أكثر قبل حفظ ملف PDF النهائي.

كود لتحويل صورة PDF إلى نص باستخدام Java

يوضح هذا الكود كيفية تحويل PDF إلى PDF قابل للبحث باستخدام Java. يمكنك تعيين لغة كشف محددة أثناء مسح PDF، وتعيين علامة لاكتشاف اللغة تلقائيًا، وتقييد التعرف على أحرف معينة أو حظر الأحرف التي تريد أن يتجاهلها OCR. تتوفر أيضًا خيارات لاختيار استراتيجية كشف مساحة/تخطيط المستند المصدر إذا لزم الأمر.

لقد علمنا هذا المقال العملية لتحويل PDF إلى PDF نصي قابل للتحديد. لتصدير البيانات من نموذج PDF إلى Excel، راجع المقال تصدير البيانات من نموذج PDF إلى Excel باستخدام Java.

Aspose قاعدة المعرفة

ابحث عن إجابات من API

تحويل ملف PDF الممسوح ضوئياً إلى PDF قابل للتحرير باستخدام Java

خطوات لجعل PDF قابل للقراءة باستخدام Java

كود لتحويل صورة PDF إلى نص باستخدام Java