Javaを使用して画像からテキストを抽出する方法

この簡単なチュートリアルでは、Javaを使用して画像からテキストを抽出するための手順とコードを含む情報を提供します。文字は、このプロセスの後に文字列に格納された写真から認識され、Javaで写真からテキストを抽出します。この文字列出力は、ディスク上のTXTファイルに保存できます。

Javaを使用して画像からテキストを抽出する手順

  1. Mavenリポジトリー構成を指定して、プロジェクトにAspose.OCRへの参照を追加します
  2. AsposeOcrクラスのインスタンスを作成して、OCRを画像に適用します
  3. テキスト抽出にRecognizePageメソッドを使用して画像を読み取る
  4. FileWriterオブジェクトを使用して、抽出したテキストをテキストファイルに保存します

このステップバイステップのアプローチでは、AsposeOcrクラスのインスタンスを作成し、入力画像ファイルに対してOCR操作を実行することにより、javaを使用して画像から単語を抽出するプロセスについて説明します。文字と単語は、OCR操作に最適な時間を費やしながら、ミスの可能性を最小限に抑えるために、優れた効率、精度、および速度で光学的に認識されます。

Javaを使用して画像からテキストを抽出するコード

import com.aspose.ocr.AsposeOCR;
import com.aspose.ocr.License;
import java.io.File;
import java.io.FileWriter;
public class ExtractTextFromImageUsingJava {
public static void main(String[] args) throws Exception { // main method for extracting text from image
License.setLicense("Aspose.OCR.lic");
// Create an instance of AsposeOcr class to apply OCR on an image
AsposeOCR TextExtractFromImage = new AsposeOCR();
// Read image using RecognizePage method for text extraction
String ExtractedTextFromImage = TextExtractFromImage.RecognizePage("ExampleOCRImageToExtractText.jpg");
// Save extracted text to a text file using FileWriter
File output = new File("TextExtractFromImageUsingOCR.txt");
FileWriter writer = new FileWriter(output);
writer.write(ExtractedTextFromImage);
writer.flush();
writer.close();
}
}

このコードスニペットは、サンプルの入力画像をロードしてから、OCR操作の実行に進みます。テキスト認識のプロセスを実行するには、入力画像のファイルパスと単純なAPI呼び出しを設定する必要があります。 AsposeOcrクラスのRecognizePageメソッドを呼び出すことができます。また、要件に応じて、前述のクラスを使用して画像を1行ずつ認識することができます。

上記のコードと手順で説明されているように、OCRを実行して、Javaを使用して画像からテキストを抽出します。ただし、この画像を他の形式に変換することに興味がある場合は、JavaでビットマップをPNGに変換する方法の記事を参照してください。

 日本語