Конвертиране на сканиран PDF в редактиран PDF с Java

Този кратък урок ви показва как да конвертирате сканиран PDF в редактиран PDF с Java. Той включва подробности за конфигуриране на IDE, списък със стъпки и примерен код за конвертиране на сканиран PDF в търсим PDF с Java. Ще получите подробности за персонализиране на процеса на сканиране на изображение и конвертиране на съдържанието в четим текст.

Стъпки за правене на PDF четим с Java

  1. Настройте IDE да използва Aspose.Total for Java за преобразуване на сканиран PDF в търсим PDF
  2. Инстанцирайте съответните лицензи за продукта, за да избегнете водни знаци в изхода
  3. Създайте екземпляр на разпознаващия двигател, използвайки класа AsposeOCR
  4. Създайте входния екземпляр, използвайки класа OcrInput, и заредете изходния сканиран PDF в него
  5. Създайте екземпляра RecognitionSettings, за да зададете параметри за персонализиране по време на сканирането на изображението
  6. Извикайте метода AsposeOCR.Recognize(), за да извлечете данни от сканирания PDF и да ги съхраните във временен PDF
  7. Заредете междинния PDF в обекта на класа Document на Aspose.PDF и задайте метаданни в него
  8. Запазете окончателния PDF на диска с текст, който може да се търси, и метаданни

Тези стъпки описват как да конвертирате PDF изображение в PDF текст с Java. Създайте обекта за разпознаващия двигател, подгответе входния файл, като добавите сканирания PDF файл към обекта OcrInput, дефинирайте параметрите в обекта RecognitionSettings, извикайте метода Recognize() за сканиране на данните и запазете резултатите в междинен PDF файл. Накрая заредете междинния PDF файл, използвайки обекта Aspose.PDF.Document, и добавете метаданни или го форматирайте допълнително преди да запазите окончателния PDF файл.

Код за конвертиране на PDF изображение в текст с Java

Този код демонстрира как да конвертирате PDF в търсим PDF, използвайки Java. Можете да зададете конкретен език за откриване при сканиране на PDF, да зададете флаг за автоматично откриване на езика, да ограничите разпознаването до конкретни знаци или да включите в черен списък знаци, които искате OCR да игнорира. Също така са налични опции за избор на стратегия за откриване на област/оформление на изходния документ, ако е необходимо.

Тази статия ни научи процеса за конвертиране на PDF в избираем текстов PDF. За експортиране на данни от PDF формуляр към Excel, вижте статията Export Data from a PDF Form to Excel using Java.

 Български