این آموزش مختصر شما را در مورد نحوه خواندن فایل PDF در جاوا راهنمایی می کند. این شامل کد جاوا برای خواندن فایل PDF است، به این ترتیب که ابتدا متنی را از PDF در جاوا در یک رشته میخوانید و سپس همه تصاویر را از فایل PDF واکشی میکنید تا آنها را روی دیسک به عنوان {{HYPERLINK2 ذخیره کنید. }}. برای خواندن PDF در جاوا نیازی به نصب هیچ ابزار شخص ثالثی نیست.
مراحل خواندن فایل PDF در جاوا
- با استفاده از مخزن Maven برای خواندن فایل PDF، Aspose.PDF را در پروژه خود پیکربندی کنید.
- فایل PDF نمونه را در شی کلاس Document بارگیری کنید
- شیء کلاس TextAbsorber را که می تواند کل متن را از فایل PDF بخواند، نمونه سازی کنید
- متن PDF را از فایل بارگذاری شده با استفاده از شی کلاس TextAbsorber بخوانید
- نمایش کل متن خوانده شده از فایل PDF روی کنسول
- برای دسترسی به تصاویر، تمام صفحات فایل PDF را تکرار کنید
- تمام تصاویر موجود در مجموعه تصاویر هر صفحه را تجزیه کنید و آنها را روی دیسک ذخیره کنید
در این آموزش گام به گام سریع، ابتدا فایل PDF مورد نظر را بارگذاری می کنیم و سپس شی کلاس TextAbsorber را که قادر به جستجوی متن در تمام صفحات PDF است، راه اندازی می کنیم. کل این متن به یک رشته بازگردانده می شود که می تواند مطابق با نیاز نمایش داده یا پردازش شود. به همین ترتیب، میتوانیم تمام تصاویر مجموعه تصاویر را تجزیه و آنها را با هر فرمتی روی دیسک ذخیره کنیم، همانطور که در این آموزش آن را به صورت JPG ذخیره کردهایم.
کد برای خواندن PDF با استفاده از جاوا
در این کد نمونه، از کلاس TextAbsorber و تابع getImages() از Page.getResources() برای خواندن PDF با استفاده از جاوا استفاده کردیم. شیء TextAbsorber برای خواندن متن توسط تابع پذیرش در مجموعه پی دی اف استفاده می شود. در حالی که تابع getImages() مجموعه getResources() تمام تصاویر یک صفحه را برمی گرداند.
توجه داشته باشید که این مراحل برای خواندن PDF در جاوا را می توان در هر یک از سیستم عامل ها مانند ویندوز، لینوکس یا macOS انجام داد. اگر میخواهید درباره کار با فایلهای PDF بیشتر بدانید، به مقاله نحوه خواندن نشانک ها در PDF با استفاده از جاوا مراجعه کنید.