Извличане на текст от изображение с помощта на Python

Този урок ще ви научи как да извличате текст от изображение с помощта на Python. Предоставя информация за настройка на средата за използване на Aspose.OCR, списък със стъпки за описание на потока на програмата и Python код за извличане на текст от изображение. Ще се научите да извличате текст от едно PNG/JPEG/PDF/TIFF/GIF/BMP изображение или колекция от изображения в директория.

Стъпки за извличане на текст от изображение в Python

  1. Задайте средата за използване на Aspose.OCR for Python via .NET за извличане на текст от изображение
  2. Създайте обект от класа AsposeOcr за четене на текст
  3. Създайте обект от класа колекция OcrInput за добавяне на изображения
  4. Задайте типа въвеждане на Ocr на DIRECTORY
  5. Добавете един или повече пътища на директория към колекцията от изображения
  6. Извикайте метода extractTextFromImage(), като предоставите обекта OcrInput
  7. Покажете целия извлечен текст на конзолата

Тези стъпки описват програмата Python за извличане на текст от изображение. Създайте обект от класа AsposeOcr, обекта OcrInput, за да поддържате колекцията от изображения, задайте списъка с изображения в колекцията и извикайте метода accept(), за да прочетете текста. Накрая, разпознатият текст се показва един по един чрез анализиране на върнатата колекция от метода accept().

Код за извличане на текст от изображение с помощта на OCR в Python

import aspose.ocr as api
from aspose.ocr import License
# Instantiate a license
license = License()
license.set_license("License.lic")
extractTextFromImage = api.AsposeOcr()
imageDatas = api.OcrInput(api.InputType.DIRECTORY)
imageDatas.add("/Users/myuser/Images/")
textExtractedFromImage = extractTextFromImage.recognize(imageDatas)
length = textExtractedFromImage.length
for i in range(length):
print(textExtractedFromImage[i].recognition_text)

Този код демонстрира извличане на текст от изображение с помощта на Python. Можете да зададете типа на въвеждане на SINGLE_IMAGE, PDF, TIFF, URL, ZIP и т.н. въз основа на вашите изисквания. Можете да добавите множество пътища на директория или пътища на изображения, като използвате метода add() в класа OcrInput.

Тази статия ни научи на процеса на извличане на данни от изображение с помощта на Python. За да прочетете ръкописното изображение, вижте статията на Преобразувайте ръкописен текст в текст с помощта на Python.

 Български