Javaを使用して画像からテキストを抽出する方法

この簡単なチュートリアルでは、Javaを使用して画像からテキストを抽出するための手順とコードを含む情報を提供します。文字は、このプロセスの後に文字列に格納された写真から認識され、Javaで写真からテキストを抽出します。この文字列出力は、ディスク上のTXTファイルに保存できます。

Javaを使用して画像からテキストを抽出する手順

  1. Mavenリポジトリー構成を指定して、プロジェクトにAspose.OCRへの参照を追加します
  2. AsposeOcrクラスのインスタンスを作成して、OCRを画像に適用します
  3. テキスト抽出にRecognizePageメソッドを使用して画像を読み取る
  4. FileWriterオブジェクトを使用して、抽出したテキストをテキストファイルに保存します

このステップバイステップのアプローチでは、AsposeOcrクラスのインスタンスを作成し、入力画像ファイルに対してOCR操作を実行することにより、javaを使用して画像から単語を抽出するプロセスについて説明します。文字と単語は、OCR操作に最適な時間を費やしながら、ミスの可能性を最小限に抑えるために、優れた効率、精度、および速度で光学的に認識されます。

Javaを使用して画像からテキストを抽出するコード

このコードスニペットは、サンプルの入力画像をロードしてから、OCR操作の実行に進みます。テキスト認識のプロセスを実行するには、入力画像のファイルパスと単純なAPI呼び出しを設定する必要があります。 AsposeOcrクラスのRecognizePageメソッドを呼び出すことができます。また、要件に応じて、前述のクラスを使用して画像を1行ずつ認識することができます。

上記のコードと手順で説明されているように、OCRを実行して、Javaを使用して画像からテキストを抽出します。ただし、この画像を他の形式に変換することに興味がある場合は、JavaでビットマップをPNGに変換する方法の記事を参照してください。

 日本語