Tìm văn bản trong hình ảnh bằng Python

Trong hướng dẫn này, bạn sẽ học cách tìm văn bản trong ảnh bằng Python. Hướng dẫn có đầy đủ thông tin chi tiết để thiết lập môi trường, danh sách các bước và mã mẫu cho tìm kiếm văn bản hình ảnh bằng Python. Bạn sẽ học cách thiết lập cờ để tùy chỉnh thao tác tìm kiếm trong các loại hình ảnh khác nhau như PNG, JPG, BMP, TIFF, v.v.

Các bước để tìm văn bản trong hình ảnh bằng Python

  1. Đặt môi trường để sử dụng Aspose.OCR for Python via .NET để tìm kiếm từ trong hình ảnh
  2. Tạo một phiên bản của công cụ Aspose OCR bằng cách sử dụng lớp AsposeOcr
  3. Cấu hình cài đặt nhận dạng với ngôn ngữ yêu cầu
  4. Kiểm tra xem từ cần tìm có trong hình ảnh hay không bằng phương pháp image_has_text()
  5. Hiển thị thông báo phù hợp theo kết quả tìm kiếm

Các bước này tóm tắt cách tìm kiếm văn bản từ hình ảnh bằng Python. Tạo một phiên bản của công cụ Aspose OCR, cấu hình cài đặt nhận dạng và xác định từ mục tiêu để tìm kiếm. Cuối cùng, gọi phương thức image_has_text() với tên hình ảnh đầu vào, từ mục tiêu, cờ để bỏ qua trường hợp và cờ tự động nghiêng để tìm kiếm từ.

Mã cho Text Finder trong Image sử dụng Python

import aspose.ocr as api # Import the Aspose OCR library
from aspose.ocr import License # Import the License class from the Aspose OCR library
# Set the Aspose OCR license
license = License()
license.set_license("license.lic") # Load the license file to activate the full features of Aspose OCR
# Create an instance of the Aspose OCR engine
asposeOcr = api.AsposeOcr()
# Configure recognition settings
settings = api.RecognitionSettings() # Create a settings object for OCR recognition
settings.language = api.Language.ENG # Set the recognition language to English (ENG)
# Define the target word to search for in the image
targetWord = "Restaurant"
# Check if the target word is present in the image
if asposeOcr.image_has_text("Receipt1.png", targetWord, settings, True, False):
# If the word is found, print a success message
print("The image contains the word " + targetWord)
else:
# If the word is not found, print a failure message
print("The image does not contain the word " + targetWord)

Mã mẫu này thể hiện tìm kiếm văn bản trong hình ảnh bằng Python. Bạn có thể thiết lập các tùy chỉnh như sử dụng các thuật toán bổ sung để nhận dạng phông chữ nhỏ, một cờ để nhận dạng một dòng duy nhất, thiết lập danh sách các vùng văn bản và một cờ để tìm kiếm văn bản trong bảng. Các tham số khác cũng có thể được thiết lập như chọn ngôn ngữ văn bản trong hình ảnh, danh sách các ký hiệu bị cấm và danh sách các ký hiệu và ký tự được phép.

Bài viết này đã hướng dẫn chúng ta quy trình tìm kiếm văn bản từ hình ảnh bằng Python. Nếu bạn muốn trích xuất văn bản từ hóa đơn, hãy tham khảo bài viết trên Trích xuất dữ liệu từ hóa đơn bằng Python.

 Tiếng Việt