Cách trích xuất văn bản từ hình ảnh bằng Java

Hướng dẫn ngắn gọn này cung cấp thông tin bao gồm các bước và mã để trích xuất văn bản từ hình ảnh bằng Java. Các ký tự được nhận dạng từ ảnh được lưu trữ trong một chuỗi sau quá trình này để trích xuất văn bản từ ảnh trong Java. Đầu ra chuỗi này có thể được lưu trữ trong tệp TXT trên đĩa.

Các bước để trích xuất văn bản từ hình ảnh bằng Java

  1. Thêm tham chiếu đến Aspose.OCR trong dự án của bạn bằng cách chỉ định cấu hình Kho lưu trữ Maven
  2. Tạo một thể hiện của lớp AsposeOcr để áp dụng OCR cho hình ảnh
  3. Đọc hình ảnh bằng phương pháp RecognizePage để trích xuất văn bản
  4. Lưu văn bản đã trích xuất vào tệp văn bản bằng đối tượng FileWriter

Cách tiếp cận từng bước này mô tả quá trình trích xuất các từ từ hình ảnh bằng cách sử dụng java bằng cách tạo một phiên bản của lớp AsposeOcr và thực hiện thao tác OCR trên tệp hình ảnh đầu vào. Các ký tự và từ được nhận dạng quang học với hiệu quả, độ chính xác và tốc độ tốt để giảm thiểu khả năng mắc lỗi trong khi dành thời gian tối ưu cho các thao tác OCR.

Mã để trích xuất văn bản từ hình ảnh bằng Java

Đoạn mã này tải ảnh đầu vào mẫu rồi tiến hành thực hiện các thao tác OCR trên ảnh đó. Bạn cần đặt đường dẫn tệp cho hình ảnh đầu vào và lệnh gọi API đơn giản để thực hiện quy trình nhận dạng văn bản. Bạn có thể gọi phương thức RecognizePage của lớp AsposeOcr, cũng như bạn có thể nhận dạng từng dòng hình ảnh bằng cách sử dụng lớp nói trên, theo yêu cầu của bạn.

Bằng cách thực hiện OCR, trích xuất văn bản từ hình ảnh bằng cách sử dụng Java như được giải thích trong mã và các bước ở trên. Tuy nhiên, nếu bạn quan tâm đến việc chuyển đổi hình ảnh này sang một số định dạng khác, hãy tham khảo bài viết trên cách chuyển đổi Bitmap sang PNG trong Java.

 Tiếng Việt