تبدیل PDF اسکن‌شده به PDF قابل ویرایش با استفاده از جاوا

این آموزش کوتاه راهنمایی می‌کند که چگونه اسکن PDF را به PDF قابل ویرایش با جاوا تبدیل کنید. شامل جزئیاتی برای پیکربندی IDE، فهرستی از مراحل، و کد نمونه برای تبدیل PDF اسکن‌شده به PDF قابل جستجو با جاوا است. شما جزئیاتی برای سفارشی‌سازی فرآیند اسکن تصویر و تبدیل محتوا به متن قابل خواندن دریافت خواهید کرد.

مراحل تبدیل PDF به قابل خواندن با استفاده از Java

  1. IDE را تنظیم کنید تا از Aspose.Total for Java برای تبدیل یک PDF اسکن‌شده به PDF قابل جستجو استفاده کنید.
  2. برای جلوگیری از نشان‌های آب در خروجی، مجوزهای محصول مربوطه را فعال کنید
  3. یک نمونه از موتور تشخیص را با استفاده از کلاس AsposeOCR ایجاد کنید
  4. یک نمونه ورودی را با استفاده از کلاس OcrInput ایجاد کنید و PDF اسکن‌شده منبع را در آن بارگذاری کنید
  5. نمونه RecognitionSettings را برای تنظیم پارامترهای سفارشی‌سازی در طول اسکن تصویر ایجاد کنید.
  6. متد AsposeOCR.Recognize() را فراخوانی کنید تا داده‌ها را از PDF اسکن‌شده دریافت کرده و در یک PDF موقت ذخیره کنید.
  7. فایل PDF میانی را در شیء کلاس Document از Aspose.PDF بارگذاری کنید و متادیتا را در آن تنظیم کنید
  8. PDF نهایی را بر روی دیسک با متن قابل جستجو و متادیتا ذخیره کنید

این مراحل توضیح می‌دهند که چگونه PDF image to PDF text using Java را تبدیل کنید. شیء موتور شناسایی را ایجاد کنید، فایل ورودی را با افزودن فایل PDF اسکن‌شده به شیء OcrInput آماده کنید، پارامترها را در شیء RecognitionSettings تعریف کنید، متد Recognize() را فراخوانی کنید تا داده‌ها اسکن شوند و نتایج در یک فایل PDF میانی ذخیره شوند. در نهایت، فایل PDF میانی را با استفاده از شیء Aspose.PDF.Document بارگذاری کنید و قبل از ذخیره‌سازی فایل PDF نهایی، متادیتا اضافه کنید یا آن را بیشتر قالب‌بندی کنید.

کد برای تبدیل تصویر PDF به متن با استفاده از جاوا

این کد نشان می‌دهد که چگونه PDF را به PDF قابل جستجو با استفاده از جاوا تبدیل کنید. می‌توانید یک زبان تشخیص خاص را هنگام اسکن PDF تنظیم کنید، پرچمی برای تشخیص خودکار زبان تنظیم کنید، تشخیص را به کاراکترهای خاص محدود کنید یا کاراکترهایی که می‌خواهید OCR نادیده بگیرد را به فهرست سیاه اضافه کنید. همچنین گزینه‌هایی برای انتخاب استراتژی تشخیص ناحیه/چیدمان سند منبع در صورت نیاز موجود است.

این مقاله به ما فرآیند تبدیل یک PDF به PDF متنی قابل انتخاب را آموزش داد. برای استخراج داده‌ها از یک فرم PDF به اکسل، به مقاله Export Data from a PDF Form to Excel using Java مراجعه کنید.

 فارسی