Deze tutorial leert je hoe je tekst uit een afbeelding haalt met Python. Het geeft informatie over het instellen van de omgeving voor het gebruik van Aspose.OCR, een lijst met stappen om de programmastroom te beschrijven en een Python-code om tekst uit een afbeelding te halen. Je leert hoe je tekst uit een enkele PNG/JPEG/PDF/TIFF/GIF/BMP-afbeelding of verzameling afbeeldingen in een directory haalt.
Stappen om tekst uit een afbeelding te extraheren in Python
- Stel de omgeving in voor het gebruik van Aspose.OCR for Python via .NET om tekst uit een afbeelding te halen
- Maak een object van de klasse AsposeOcr voor het lezen van tekst
- Maak een object van de OcrInput-collectieklasse voor het toevoegen van afbeeldingen
- Stel het Ocr-invoertype in op DIRECTORY
- Voeg een of meer directorypaden toe aan de afbeeldingenverzameling
- Roep de extractTextFromImage()-methode aan door het OcrInput-object op te geven
- Alle geëxtraheerde tekst weergeven op de console
Deze stappen beschrijven het Python-programma om tekst uit een afbeelding te halen. Maak een object van de AsposeOcr-klasse, het OcrInput-object om de verzameling afbeeldingen te onderhouden, stel de afbeeldingenlijst in de verzameling in en roep de recognize()-methode aan om de tekst te lezen. Ten slotte wordt de herkende tekst één voor één weergegeven door de geretourneerde verzameling van de recognize()-methode te parseren.
Code om tekst uit een afbeelding te extraheren met behulp van OCR in Python
import aspose.ocr as api | |
from aspose.ocr import License | |
# Instantiate a license | |
license = License() | |
license.set_license("License.lic") | |
extractTextFromImage = api.AsposeOcr() | |
imageDatas = api.OcrInput(api.InputType.DIRECTORY) | |
imageDatas.add("/Users/myuser/Images/") | |
textExtractedFromImage = extractTextFromImage.recognize(imageDatas) | |
length = textExtractedFromImage.length | |
for i in range(length): | |
print(textExtractedFromImage[i].recognition_text) |
Deze code demonstreert de tekstextractie uit een afbeelding met behulp van Python. U kunt het invoertype instellen op SINGLE_IMAGE, PDF, TIFF, URL, ZIP, etc. op basis van uw vereisten. U kunt meerdere directorypaden of afbeeldingspaden toevoegen met behulp van de add()-methode in de OcrInput-klasse.
Dit artikel heeft ons het proces van data-extractie uit een afbeelding met behulp van Python geleerd. Om de handgeschreven afbeelding te lezen, raadpleeg het artikel op Handschrift naar tekst converteren met Python.