Extrair texto de imagem usando Python

Este tutorial ensinará como extrair texto de uma imagem usando Python. Ele fornece informações para definir o ambiente para usar Aspose.OCR, uma lista de etapas para descrever o fluxo do programa e um código Python para extrair texto de uma imagem. Você aprenderá a extrair texto de uma única imagem PNG/JPEG/PDF/TIFF/GIF/BMP ou coleção de imagens em um diretório.

Etapas para extrair texto de imagem em Python

  1. Defina o ambiente para usar Aspose.OCR for Python via .NET para extrair texto de uma imagem
  2. Crie um objeto da classe AsposeOcr para leitura de texto
  3. Crie um objeto da classe de coleção OcrInput para adicionar imagens
  4. Defina o tipo de entrada Ocr como DIRETÓRIO
  5. Adicione um ou mais caminhos de diretório à coleção de imagens
  6. Chame o método extractTextFromImage() fornecendo o objeto OcrInput
  7. Exibir todo o texto extraído no console

Estas etapas descrevem o programa Python para extrair texto de imagem. Crie um objeto da classe AsposeOcr, o objeto OcrInput para manter a coleção de imagens, defina a lista de imagens na coleção e chame o método recognize() para ler o texto. Finalmente, o texto reconhecido é exibido um por um, analisando a coleção retornada do método recognize().

Código para extrair texto de imagem usando OCR em Python

import aspose.ocr as api
from aspose.ocr import License
# Instantiate a license
license = License()
license.set_license("License.lic")
extractTextFromImage = api.AsposeOcr()
imageDatas = api.OcrInput(api.InputType.DIRECTORY)
imageDatas.add("/Users/myuser/Images/")
textExtractedFromImage = extractTextFromImage.recognize(imageDatas)
length = textExtractedFromImage.length
for i in range(length):
print(textExtractedFromImage[i].recognition_text)

Este código demonstra a extração de texto de imagem usando Python. Você pode definir o tipo de entrada como SINGLE_IMAGE, PDF, TIFF, URL, ZIP, etc. com base em seus requisitos. Você pode adicionar vários caminhos de diretório ou caminhos de imagem usando o método add() na classe OcrInput.

Este artigo nos ensinou o processo de extração de dados de imagem usando Python. Para ler a imagem manuscrita, consulte o artigo em Converter manuscrito em texto usando Python.

 Português