نحوه خواندن فایل PDF در جاوا

این آموزش مختصر شما را در مورد نحوه خواندن فایل PDF در جاوا راهنمایی می کند. این شامل کد جاوا برای خواندن فایل PDF است، به این ترتیب که ابتدا متنی را از PDF در جاوا در یک رشته می‌خوانید و سپس همه تصاویر را از فایل PDF واکشی می‌کنید تا آنها را روی دیسک به عنوان {{HYPERLINK2 ذخیره کنید. }}. برای خواندن PDF در جاوا نیازی به نصب هیچ ابزار شخص ثالثی نیست.

مراحل خواندن فایل PDF در جاوا

  1. با استفاده از مخزن Maven برای خواندن فایل PDF، Aspose.PDF را در پروژه خود پیکربندی کنید.
  2. فایل PDF نمونه را در شی کلاس Document بارگیری کنید
  3. شیء کلاس TextAbsorber را که می تواند کل متن را از فایل PDF بخواند، نمونه سازی کنید
  4. متن PDF را از فایل بارگذاری شده با استفاده از شی کلاس TextAbsorber بخوانید
  5. نمایش کل متن خوانده شده از فایل PDF روی کنسول
  6. برای دسترسی به تصاویر، تمام صفحات فایل PDF را تکرار کنید
  7. تمام تصاویر موجود در مجموعه تصاویر هر صفحه را تجزیه کنید و آنها را روی دیسک ذخیره کنید

در این آموزش گام به گام سریع، ابتدا فایل PDF مورد نظر را بارگذاری می کنیم و سپس شی کلاس TextAbsorber را که قادر به جستجوی متن در تمام صفحات PDF است، راه اندازی می کنیم. کل این متن به یک رشته بازگردانده می شود که می تواند مطابق با نیاز نمایش داده یا پردازش شود. به همین ترتیب، می‌توانیم تمام تصاویر مجموعه تصاویر را تجزیه و آن‌ها را با هر فرمتی روی دیسک ذخیره کنیم، همانطور که در این آموزش آن را به صورت JPG ذخیره کرده‌ایم.

کد برای خواندن PDF با استفاده از جاوا

در این کد نمونه، از کلاس TextAbsorber و تابع getImages() از Page.getResources() برای خواندن PDF با استفاده از جاوا استفاده کردیم. شیء TextAbsorber برای خواندن متن توسط تابع پذیرش در مجموعه پی دی اف استفاده می شود. در حالی که تابع getImages() مجموعه getResources() تمام تصاویر یک صفحه را برمی گرداند.

توجه داشته باشید که این مراحل برای خواندن PDF در جاوا را می توان در هر یک از سیستم عامل ها مانند ویندوز، لینوکس یا macOS انجام داد. اگر می‌خواهید درباره کار با فایل‌های PDF بیشتر بدانید، به مقاله نحوه خواندن نشانک ها در PDF با استفاده از جاوا مراجعه کنید.

 فارسی