Como extrair texto de imagem usando Java

Este breve tutorial fornece informações, incluindo as etapas e o código para extrair texto da imagem usando Java. Os caracteres são reconhecidos da foto que é armazenada em uma string após este processo para extrair texto da foto em Java. Esta saída de string pode ser armazenada em um arquivo TXT no disco.

Etapas para extrair texto de imagem usando Java

  1. Adicione a referência a Aspose.OCR em seu projeto especificando as configurações do Repositório Maven
  2. Crie uma instância da classe AsposeOcr para aplicar o OCR a uma imagem
  3. Leia a imagem usando o método RecognizePage para extração de texto
  4. Salve o texto extraído em um arquivo de texto usando o objeto FileWriter

Essa abordagem passo a passo descreve o processo para extrair palavras da imagem usando java criando uma instância da classe AsposeOcr e executando a operação de OCR no arquivo de imagem de entrada. Os caracteres e as palavras são reconhecidos opticamente com boa eficiência, precisão e velocidade para que haja chances mínimas de erros ao passar o tempo ideal nas operações de OCR.

Código para extrair texto da imagem usando Java

import com.aspose.ocr.AsposeOCR;
import com.aspose.ocr.License;
import java.io.File;
import java.io.FileWriter;
public class ExtractTextFromImageUsingJava {
public static void main(String[] args) throws Exception { // main method for extracting text from image
License.setLicense("Aspose.OCR.lic");
// Create an instance of AsposeOcr class to apply OCR on an image
AsposeOCR TextExtractFromImage = new AsposeOCR();
// Read image using RecognizePage method for text extraction
String ExtractedTextFromImage = TextExtractFromImage.RecognizePage("ExampleOCRImageToExtractText.jpg");
// Save extracted text to a text file using FileWriter
File output = new File("TextExtractFromImageUsingOCR.txt");
FileWriter writer = new FileWriter(output);
writer.write(ExtractedTextFromImage);
writer.flush();
writer.close();
}
}

Esse trecho de código carrega a imagem de entrada de amostra e, em seguida, prossegue para executar operações de OCR nela. Você precisa definir o caminho do arquivo para a imagem de entrada e as chamadas de API simples para executar o processo de reconhecimento de texto. Você pode chamar o método RecognizePage da classe AsposeOcr, assim como reconhecer a imagem linha por linha usando a classe acima mencionada, conforme seus requisitos.

Ao executar o OCR, extraia o texto das imagens usando Java, conforme explicado no código e nas etapas acima. No entanto, se estiver interessado em converter esta imagem para outro formato, consulte o artigo em como converter bitmap para PNG em Java.

 Português