Ce tutoriel vous apprendra à extraire du texte d’une image à l’aide de Python. Il fournit des informations pour définir l’environnement d’utilisation d’Aspose.OCR, une liste d’étapes pour décrire le déroulement du programme et un code Python pour extraire du texte d’une image. Vous apprendrez à extraire du texte d’une seule image PNG/JPEG/PDF/TIFF/GIF/BMP ou d’une collection d’images dans un répertoire.
Étapes pour extraire du texte d’une image en Python
- Définir l’environnement pour utiliser Aspose.OCR for Python via .NET pour extraire du texte d’une image
- Créer un objet de la classe AsposeOcr pour lire du texte
- Créez un objet de la classe de collection OcrInput pour ajouter des images
- Définissez le type d’entrée Ocr sur DIRECTORY
- Ajoutez un ou plusieurs chemins de répertoire à la collection d’images
- Appelez la méthode extractTextFromImage() en fournissant l’objet OcrInput
- Afficher tout le texte extrait sur la console
Ces étapes décrivent le programme Python pour extraire le texte d’une image. Créez un objet de la classe AsposeOcr, l’objet OcrInput pour maintenir la collection d’images, définissez la liste des images dans la collection et appelez la méthode recognize() pour lire le texte. Enfin, le texte reconnu est affiché un par un en analysant la collection renvoyée par la méthode recognize().
Code pour extraire du texte d’une image à l’aide de l’OCR en Python
import aspose.ocr as api | |
from aspose.ocr import License | |
# Instantiate a license | |
license = License() | |
license.set_license("License.lic") | |
extractTextFromImage = api.AsposeOcr() | |
imageDatas = api.OcrInput(api.InputType.DIRECTORY) | |
imageDatas.add("/Users/myuser/Images/") | |
textExtractedFromImage = extractTextFromImage.recognize(imageDatas) | |
length = textExtractedFromImage.length | |
for i in range(length): | |
print(textExtractedFromImage[i].recognition_text) |
Ce code illustre l’extraction de texte à partir d’une image à l’aide de Python. Vous pouvez définir le type d’entrée sur SINGLE_IMAGE, PDF, TIFF, URL, ZIP, etc. en fonction de vos besoins. Vous pouvez ajouter plusieurs chemins de répertoire ou chemins d’image en utilisant la méthode add() de la classe OcrInput.
Cet article nous a montré le processus d’extraction de données à partir d’une image à l’aide de Python. Pour lire l’image manuscrite, reportez-vous à l’article sur Convertir l’écriture manuscrite en texte à l’aide de Python.