이 튜토리얼에서는 Python을 사용하여 이미지에서 텍스트를 추출하는 방법을 알려드립니다. Aspose.OCR을 사용하기 위한 환경을 설정하는 방법, 프로그램 흐름을 설명하는 단계 목록, 이미지에서 텍스트를 추출하는 Python 코드를 제공합니다. 단일 PNG/JPEG/PDF/TIFF/GIF/BMP 이미지 또는 디렉토리의 이미지 모음에서 텍스트를 추출하는 방법을 배우게 됩니다.
파이썬에서 이미지에서 텍스트를 추출하는 단계
- Aspose.OCR for Python via .NET를 사용하여 이미지에서 텍스트를 추출하기 위한 환경을 설정합니다.
- 텍스트를 읽기 위한 AsposeOcr 클래스의 객체를 생성합니다.
- 이미지 추가를 위한 OcrInput 컬렉션 클래스의 객체를 생성합니다.
- Ocr 입력 유형을 DIRECTORY로 설정하세요
- 이미지 컬렉션에 하나 이상의 디렉토리 경로를 추가합니다.
- OcrInput 객체를 제공하여 extractTextFromImage() 메서드를 호출합니다.
- 추출된 모든 텍스트를 콘솔에 표시합니다.
이 단계에서는 이미지에서 텍스트를 추출하는 Python 프로그램을 설명합니다. AsposeOcr 클래스의 객체, 이미지 컬렉션을 유지하기 위한 OcrInput 객체를 만들고, 컬렉션에 이미지 목록을 설정하고, 인식() 메서드를 호출하여 텍스트를 읽습니다. 마지막으로 인식된 텍스트는 인식() 메서드에서 반환된 컬렉션을 구문 분석하여 하나씩 표시됩니다.
Python에서 OCR을 사용하여 이미지에서 텍스트를 추출하는 코드
import aspose.ocr as api | |
from aspose.ocr import License | |
# Instantiate a license | |
license = License() | |
license.set_license("License.lic") | |
extractTextFromImage = api.AsposeOcr() | |
imageDatas = api.OcrInput(api.InputType.DIRECTORY) | |
imageDatas.add("/Users/myuser/Images/") | |
textExtractedFromImage = extractTextFromImage.recognize(imageDatas) | |
length = textExtractedFromImage.length | |
for i in range(length): | |
print(textExtractedFromImage[i].recognition_text) |
이 코드는 Python을 사용하여 이미지에서 텍스트 추출을 보여줍니다. 요구 사항에 따라 입력 유형을 SINGLE_IMAGE, PDF, TIFF, URL, ZIP 등으로 설정할 수 있습니다. OcrInput 클래스의 add() 메서드를 사용하여 여러 디렉토리 경로나 이미지 경로를 추가할 수 있습니다.
이 글에서는 Python을 사용하여 이미지에서 데이터 추출하는 과정을 알려드렸습니다. 손으로 쓴 이미지를 읽으려면 Python을 사용하여 필기체를 텍스트로 변환의 글을 참조하세요.