このチュートリアルでは、Python を使用して画像からテキストを抽出する 方法を説明します。Aspose.OCR を使用するための環境設定に関する情報、プログラム フローを説明する手順の一覧、画像からテキストを抽出する Python コード を提供します。単一の PNG/JPEG/PDF/TIFF/GIF/BMP 画像またはディレクトリ内の画像のコレクションからテキストを抽出する方法を学習します。
Pythonで画像からテキストを抽出する手順
- Aspose.OCR for Python via .NET を使用して画像からテキストを抽出するための環境を設定します
- テキストを読むための AsposeOcr クラスのオブジェクトを作成する
- 画像を追加するための OcrInput コレクションクラスのオブジェクトを作成します
- Ocr入力タイプをDIRECTORYに設定する
- 画像コレクションに1つ以上のディレクトリパスを追加します
- OcrInputオブジェクトを指定してextractTextFromImage()メソッドを呼び出す
- 抽出したテキストをすべてコンソールに表示する
これらの手順では、画像からテキストを抽出する Python プログラムについて説明します。AsposeOcr クラスのオブジェクト、画像のコレクションを管理する OcrInput オブジェクトを作成し、コレクションに画像リストを設定し、recognize() メソッドを呼び出してテキストを読み取ります。最後に、recognize() メソッドから返されたコレクションを解析して、認識されたテキストを 1 つずつ表示します。
Python で OCR を使用して画像からテキストを抽出するコード
import aspose.ocr as api | |
from aspose.ocr import License | |
# Instantiate a license | |
license = License() | |
license.set_license("License.lic") | |
extractTextFromImage = api.AsposeOcr() | |
imageDatas = api.OcrInput(api.InputType.DIRECTORY) | |
imageDatas.add("/Users/myuser/Images/") | |
textExtractedFromImage = extractTextFromImage.recognize(imageDatas) | |
length = textExtractedFromImage.length | |
for i in range(length): | |
print(textExtractedFromImage[i].recognition_text) |
このコードは、Python を使用して画像からテキストを抽出する方法を示しています。 入力タイプは、要件に応じて SINGLE_IMAGE、PDF、TIFF、URL、ZIP などに設定できます。 OcrInput クラスの add() メソッドを使用して、複数のディレクトリ パスまたは画像パスを追加できます。
この記事では、Python を使用して画像からデータを抽出するプロセスについて説明しました。手書きの画像を読み取るには、Pythonを使用して手書きをテキストに変換する の記事を参照してください。