يرشدك هذا البرنامج التعليمي الموجز إلى ** كيفية قراءة ملف PDF في Java **. يحتوي على ** كود Java لقراءة ملف PDF ** بحيث تقرأ أولاً نصًا من PDF في Java في سلسلة ثم تجلب جميع الصور من ملف PDF لحفظها على القرص كـ JPG. ليست هناك حاجة لتثبيت أي أداة خارجية * لقراءة PDF في Java *.
خطوات قراءة ملف PDF بجافا
- قم بتكوين Aspose.PDF في مشروعك باستخدام مستودع Maven لقراءة ملف PDF
- قم بتحميل نموذج ملف PDF في كائن فئة Document
- إنشاء كائن فئة TextAbsorber يمكنه قراءة النص بأكمله من ملف PDF
- قراءة نص PDF من الملف المحمل باستخدام كائن فئة TextAbsorber
- اعرض النص الكامل المقروء من ملف PDF على وحدة التحكم
- كرر خلال جميع الصفحات في ملف PDF للوصول إلى الصور
- تحليل جميع الصور في كل مجموعة صور صفحة وحفظها على القرص
في هذا البرنامج التعليمي السريع خطوة بخطوة ، نقوم أولاً بتحميل ملف PDF الهدف ثم نبدأ كائن فئة TextAbsorber القادر على البحث عن النص من خلال جميع الصفحات في ملف PDF. يتم إرجاع هذا النص بالكامل إلى سلسلة يمكن عرضها أو معالجتها وفقًا للمتطلبات. وبالمثل ، يمكننا تحليل جميع الصور الموجودة في مجموعة الصور وحفظها على القرص بأي تنسيق حيث قمنا بحفظها بتنسيق JPG في هذا البرنامج التعليمي.
كود لقراءة PDF باستخدام Java
في نموذج التعليمات البرمجية هذا ، استخدمنا فئة TextAbsorber ووظيفة getImages () الخاصة بـ Page.getResources () * لقراءة ملف PDF باستخدام Java *. يتم استخدام كائن TextAbsorber لقراءة النص عن طريق وظيفة القبول في مجموعة صفحات PDF. بينما تقوم وظيفة getImages () لمجموعة getResources () بإرجاع جميع الصور الموجودة على الصفحة.
لاحظ أنه يمكن تنفيذ هذه الخطوات لقراءة PDF في Java في أي من أنظمة التشغيل مثل Windows أو Linux أو macOS. إذا كنت تريد معرفة المزيد حول العمل مع ملفات PDF ، فراجع المقالة على كيفية قراءة الإشارات المرجعية في PDF باستخدام Java.