การแยกข้อความจากภาพโดยใช้ Python

บทช่วยสอนนี้จะสอนคุณถึงวิธีการ ดึงข้อความจากภาพโดยใช้ Python โดยจะมีข้อมูลเพื่อกำหนดสภาพแวดล้อมสำหรับการใช้ Aspose.OCR รายการขั้นตอนในการอธิบายขั้นตอนการทำงานของโปรแกรม และ โค้ด Python สำหรับดึงข้อความจากภาพ คุณจะได้เรียนรู้วิธีดึงข้อความจากภาพ PNG/JPEG/PDF/TIFF/GIF/BMP เดี่ยว หรือจากคอลเล็กชันภาพในไดเรกทอรี

ขั้นตอนในการแยกข้อความจากภาพใน Python

  1. ตั้งค่าสภาพแวดล้อมสำหรับการใช้ Aspose.OCR for Python via .NET เพื่อดึงข้อความจากรูปภาพ
  2. สร้างวัตถุของคลาส AsposeOcr เพื่ออ่านข้อความ
  3. สร้างวัตถุของคลาสคอลเลกชัน OcrInput สำหรับการเพิ่มรูปภาพ
  4. ตั้งค่าชนิดอินพุต Ocr เป็น DIRECTORY
  5. เพิ่มเส้นทางไดเรกทอรีหนึ่งรายการหรือมากกว่าลงในคอลเลคชันรูปภาพ
  6. เรียกใช้เมธอด extractTextFromImage() โดยระบุอ็อบเจ็กต์ OcrInput
  7. แสดงข้อความทั้งหมดที่แยกออกมาบนคอนโซล

ขั้นตอนเหล่านี้อธิบายถึง โปรแกรม Python ที่ใช้ในการแยกข้อความจากรูปภาพ สร้างอ็อบเจ็กต์ของคลาส AsposeOcr อ็อบเจ็กต์ OcrInput เพื่อรักษาคอลเล็กชันของรูปภาพ ตั้งค่ารายการรูปภาพในคอลเล็กชัน และเรียกใช้เมธอด perceive() เพื่ออ่านข้อความ ในที่สุด ข้อความที่รับรู้จะแสดงทีละรายการโดยการวิเคราะห์คอลเล็กชันที่ส่งคืนจากเมธอด perceive()

โค้ดสำหรับดึงข้อความจากภาพโดยใช้ OCR ใน Python

import aspose.ocr as api
from aspose.ocr import License
# Instantiate a license
license = License()
license.set_license("License.lic")
extractTextFromImage = api.AsposeOcr()
imageDatas = api.OcrInput(api.InputType.DIRECTORY)
imageDatas.add("/Users/myuser/Images/")
textExtractedFromImage = extractTextFromImage.recognize(imageDatas)
length = textExtractedFromImage.length
for i in range(length):
print(textExtractedFromImage[i].recognition_text)

โค้ดนี้สาธิตการ แยกข้อความจากรูปภาพโดยใช้ Python คุณสามารถตั้งค่าประเภทอินพุตเป็น SINGLE_IMAGE, PDF, TIFF, URL, ZIP เป็นต้น ตามความต้องการของคุณ คุณสามารถเพิ่มเส้นทางไดเรกทอรีหรือเส้นทางรูปภาพหลายเส้นทางได้โดยใช้เมธอด add() ในคลาส OcrInput

บทความนี้สอนเราเกี่ยวกับกระบวนการ ดึงข้อมูลจากภาพโดยใช้ Python หากต้องการอ่านภาพลายมือ โปรดอ่านบทความที่ แปลงลายมือเป็นข้อความโดยใช้ Python

 ไทย