Este breve tutorial brinda información, incluidos los pasos y el código para extraer texto de una imagen usando Java. Los caracteres se reconocen a partir de la foto que se almacena en una cadena después de este proceso para extraer texto de la foto en Java. Esta cadena de salida se puede almacenar en un archivo TXT en el disco.
Pasos para extraer texto de una imagen usando Java
- Agregue la referencia a Aspose.OCR en su proyecto especificando las configuraciones del Repositorio de Maven
- Cree una instancia de la clase AsposeOcr para aplicar OCR a una imagen
- Lea la imagen usando el método RecognizePage para la extracción de texto
- Guarde el texto extraído en un archivo de texto usando el objeto FileWriter
Este enfoque paso a paso describe el proceso para extraer palabras de la imagen usando java creando una instancia de la clase AsposeOcr y realizando la operación de OCR en el archivo de imagen de entrada. Los caracteres y las palabras se reconocen ópticamente con buena eficiencia, precisión y velocidad, por lo que las posibilidades de errores son mínimas mientras se dedica un tiempo óptimo a las operaciones de OCR.
Código para extraer texto de una imagen usando Java
import com.aspose.ocr.AsposeOCR; | |
import com.aspose.ocr.License; | |
import java.io.File; | |
import java.io.FileWriter; | |
public class ExtractTextFromImageUsingJava { | |
public static void main(String[] args) throws Exception { // main method for extracting text from image | |
License.setLicense("Aspose.OCR.lic"); | |
// Create an instance of AsposeOcr class to apply OCR on an image | |
AsposeOCR TextExtractFromImage = new AsposeOCR(); | |
// Read image using RecognizePage method for text extraction | |
String ExtractedTextFromImage = TextExtractFromImage.RecognizePage("ExampleOCRImageToExtractText.jpg"); | |
// Save extracted text to a text file using FileWriter | |
File output = new File("TextExtractFromImageUsingOCR.txt"); | |
FileWriter writer = new FileWriter(output); | |
writer.write(ExtractedTextFromImage); | |
writer.flush(); | |
writer.close(); | |
} | |
} |
Este fragmento de código carga la imagen de entrada de muestra y luego procede a realizar operaciones de OCR en ella. Debe configurar la ruta del archivo para la imagen de entrada y las llamadas API simples para ejecutar el proceso de reconocimiento de texto. Puede llamar al método RecognizePage de la clase AsposeOcr, así como también puede reconocer la imagen línea por línea utilizando la clase mencionada anteriormente, según sus requisitos.
Al realizar OCR, extraiga el texto de las imágenes usando Java como se explica en el código y los pasos anteriores. Sin embargo, si está interesado en convertir esta imagen a algún otro formato, consulte el artículo sobre cómo convertir mapa de bits a PNG en Java.