Преобразование рукописного текста в текст с помощью Python

В этом уроке вы научитесь преобразовывать рукописный текст в текст с помощью Python. В нем есть все детали для настройки IDE, список шагов и пример кода для разработки приложения для преобразования рукописного текста в текст с помощью Python. Это приложение будет считывать рукописные заметки с загруженного изображения PNG и преобразовывать их в доступный для поиска и редактирования цифровой текст.

Шаги по преобразованию рукописных заметок в текст с помощью Python

  1. Установите Aspose.OCR for Python via .NET, следуя инструкциям здесь
  2. Создайте экземпляр OCR-движка, используя класс AsposeOcr
  3. Инициализируйте входной контейнер для обработки OCR с одним типом изображения
  4. Добавьте файл изображения для обработки с целью распознавания текста.
  5. Выполните рукописную надпись text recognition на предоставленном изображении
  6. Получить общее количество распознанных текстовых сегментов
  7. Пройтись по всем распознанным текстовым сегментам и распечатать

Эти шаги описывают, как реализовать распознавание рукописного текста с помощью Python. Создайте экземпляр OCR-движка, создайте входной контейнер для изображений, задайте входное изображение и выполните распознавание рукописного текста. Получите общее количество распознанных текстовых сегментов и отобразите их на экране, проанализировав выходную коллекцию.

Код для преобразования рукописного текста в текст с помощью Python

import aspose.ocr as api # Import the Aspose.OCR module
from aspose.ocr import License # Import the License class from the module
license = License() # Instantiate and apply a license
license.set_license("License.lic") # Load the license file
extractTextFromImage = api.AsposeOcr() # Create OCR engine
imageDatas = api.OcrInput(api.InputType.SINGLE_IMAGE) # Initialize an input container
imageDatas.add("sample2.png")# Add the image file
# Perform handwritten text recognition on the provided image
textExtractedFromImage = extractTextFromImage.recognize_handwritten_text(imageDatas)
length = textExtractedFromImage.length # Get the total number
# Iterate through all recognized text segments
for i in range(length):
# Print each recognized text segment to the console
print(textExtractedFromImage[i].recognition_text)
Этот пример кода демонстрирует приложение, которое преобразует рукописный текст в текст с помощью Python. Вы можете установить InputType на PDF для отсканированного PDF, DIRECTORY для нескольких изображений или ZIP и т. д. Входное изображение может быть GIF, PNG, JPEG, BMP или TIFF.

Эта статья научила нас, как преобразовать рукописные заметки в текст с помощью Python. Чтобы извлечь текст из отсканированного PDF-файла, обратитесь к статье на Как извлечь текст из отсканированного PDF-файла на C#.

 Русский