این آموزش کوتاه راهنمایی میکند که چگونه اسکن PDF را به PDF قابل ویرایش با جاوا تبدیل کنید. شامل جزئیاتی برای پیکربندی IDE، فهرستی از مراحل، و کد نمونه برای تبدیل PDF اسکنشده به PDF قابل جستجو با جاوا است. شما جزئیاتی برای سفارشیسازی فرآیند اسکن تصویر و تبدیل محتوا به متن قابل خواندن دریافت خواهید کرد.
مراحل تبدیل PDF به قابل خواندن با استفاده از Java
- IDE را تنظیم کنید تا از Aspose.Total for Java برای تبدیل یک PDF اسکنشده به PDF قابل جستجو استفاده کنید.
- برای جلوگیری از نشانهای آب در خروجی، مجوزهای محصول مربوطه را فعال کنید
- یک نمونه از موتور تشخیص را با استفاده از کلاس AsposeOCR ایجاد کنید
- یک نمونه ورودی را با استفاده از کلاس OcrInput ایجاد کنید و PDF اسکنشده منبع را در آن بارگذاری کنید
- نمونه RecognitionSettings را برای تنظیم پارامترهای سفارشیسازی در طول اسکن تصویر ایجاد کنید.
- متد AsposeOCR.Recognize() را فراخوانی کنید تا دادهها را از PDF اسکنشده دریافت کرده و در یک PDF موقت ذخیره کنید.
- فایل PDF میانی را در شیء کلاس Document از Aspose.PDF بارگذاری کنید و متادیتا را در آن تنظیم کنید
- PDF نهایی را بر روی دیسک با متن قابل جستجو و متادیتا ذخیره کنید
این مراحل توضیح میدهند که چگونه PDF image to PDF text using Java را تبدیل کنید. شیء موتور شناسایی را ایجاد کنید، فایل ورودی را با افزودن فایل PDF اسکنشده به شیء OcrInput آماده کنید، پارامترها را در شیء RecognitionSettings تعریف کنید، متد Recognize() را فراخوانی کنید تا دادهها اسکن شوند و نتایج در یک فایل PDF میانی ذخیره شوند. در نهایت، فایل PDF میانی را با استفاده از شیء Aspose.PDF.Document بارگذاری کنید و قبل از ذخیرهسازی فایل PDF نهایی، متادیتا اضافه کنید یا آن را بیشتر قالببندی کنید.
کد برای تبدیل تصویر PDF به متن با استفاده از جاوا
این کد نشان میدهد که چگونه PDF را به PDF قابل جستجو با استفاده از جاوا تبدیل کنید. میتوانید یک زبان تشخیص خاص را هنگام اسکن PDF تنظیم کنید، پرچمی برای تشخیص خودکار زبان تنظیم کنید، تشخیص را به کاراکترهای خاص محدود کنید یا کاراکترهایی که میخواهید OCR نادیده بگیرد را به فهرست سیاه اضافه کنید. همچنین گزینههایی برای انتخاب استراتژی تشخیص ناحیه/چیدمان سند منبع در صورت نیاز موجود است.
این مقاله به ما فرآیند تبدیل یک PDF به PDF متنی قابل انتخاب را آموزش داد. برای استخراج دادهها از یک فرم PDF به اکسل، به مقاله Export Data from a PDF Form to Excel using Java مراجعه کنید.