Denna handledning kommer att lära dig hur du extraherar text från bild med Python. Den tillhandahåller information för att ställa in miljön för användning av Aspose.OCR, en lista med steg för att beskriva programflödet och en Python-kod för att extrahera text från bild. Du kommer att lära dig att extrahera text från en enda PNG/JPEG/PDF/TIFF/GIF/BMP-bild eller bildsamling i en katalog.
Steg för att extrahera text från bild i Python
- Ställ in miljön för att använda Aspose.OCR for Python via .NET för att extrahera text från en bild
- Skapa ett objekt av klassen AsposeOcr för att läsa text
- Skapa ett objekt av samlingsklassen OcrInput för att lägga till bilder
- Ställ in Ocr-ingångstypen på DIRECTORY
- Lägg till en eller flera katalogsökvägar till bildsamlingen
- Anropa metoden extractTextFromImage() genom att tillhandahålla OcrInput-objektet
- Visa all extraherad text på konsolen
Dessa steg beskriver Python-programmet för att extrahera text från bild. Skapa ett objekt av klassen AsposeOcr, OcrInput-objektet för att underhålla samlingen av bilder, ställ in bildlistan i samlingen och anropa metoden identifi() för att läsa texten. Slutligen visas den igenkända texten en efter en genom att analysera den returnerade samlingen från metoden identifi() .
Kod för att extrahera text från bild med OCR i Python
import aspose.ocr as api | |
from aspose.ocr import License | |
# Instantiate a license | |
license = License() | |
license.set_license("License.lic") | |
extractTextFromImage = api.AsposeOcr() | |
imageDatas = api.OcrInput(api.InputType.DIRECTORY) | |
imageDatas.add("/Users/myuser/Images/") | |
textExtractedFromImage = extractTextFromImage.recognize(imageDatas) | |
length = textExtractedFromImage.length | |
for i in range(length): | |
print(textExtractedFromImage[i].recognition_text) |
Den här koden demonstrerar textextraktionen från bild med Python. Du kan ställa in inmatningstypen till SINGLE_IMAGE, PDF, TIFF, URL, ZIP, etc. baserat på dina krav. Du kan lägga till flera katalogsökvägar eller bildsökvägar genom att använda metoden add() i klassen OcrInput.
Den här artikeln har lärt oss processen för dataextraktion från bild med Python. För att läsa den handskrivna bilden, se artikeln om Konvertera handstil till text med Python.