この簡単なチュートリアルでは、Javaを使用して画像からテキストを抽出するための手順とコードを含む情報を提供します。文字は、このプロセスの後に文字列に格納された写真から認識され、Javaで写真からテキストを抽出します。この文字列出力は、ディスク上のTXTファイルに保存できます。
Javaを使用して画像からテキストを抽出する手順
- Mavenリポジトリー構成を指定して、プロジェクトにAspose.OCRへの参照を追加します
- AsposeOcrクラスのインスタンスを作成して、OCRを画像に適用します
- テキスト抽出にRecognizePageメソッドを使用して画像を読み取る
- FileWriterオブジェクトを使用して、抽出したテキストをテキストファイルに保存します
このステップバイステップのアプローチでは、AsposeOcrクラスのインスタンスを作成し、入力画像ファイルに対してOCR操作を実行することにより、javaを使用して画像から単語を抽出するプロセスについて説明します。文字と単語は、OCR操作に最適な時間を費やしながら、ミスの可能性を最小限に抑えるために、優れた効率、精度、および速度で光学的に認識されます。
Javaを使用して画像からテキストを抽出するコード
import com.aspose.ocr.AsposeOCR; | |
import com.aspose.ocr.License; | |
import java.io.File; | |
import java.io.FileWriter; | |
public class ExtractTextFromImageUsingJava { | |
public static void main(String[] args) throws Exception { // main method for extracting text from image | |
License.setLicense("Aspose.OCR.lic"); | |
// Create an instance of AsposeOcr class to apply OCR on an image | |
AsposeOCR TextExtractFromImage = new AsposeOCR(); | |
// Read image using RecognizePage method for text extraction | |
String ExtractedTextFromImage = TextExtractFromImage.RecognizePage("ExampleOCRImageToExtractText.jpg"); | |
// Save extracted text to a text file using FileWriter | |
File output = new File("TextExtractFromImageUsingOCR.txt"); | |
FileWriter writer = new FileWriter(output); | |
writer.write(ExtractedTextFromImage); | |
writer.flush(); | |
writer.close(); | |
} | |
} |
このコードスニペットは、サンプルの入力画像をロードしてから、OCR操作の実行に進みます。テキスト認識のプロセスを実行するには、入力画像のファイルパスと単純なAPI呼び出しを設定する必要があります。 AsposeOcrクラスのRecognizePageメソッドを呼び出すことができます。また、要件に応じて、前述のクラスを使用して画像を1行ずつ認識することができます。
上記のコードと手順で説明されているように、OCRを実行して、Javaを使用して画像からテキストを抽出します。ただし、この画像を他の形式に変換することに興味がある場合は、JavaでビットマップをPNGに変換する方法の記事を参照してください。