บทช่วยสอนนี้จะสอนคุณถึงวิธีการ ดึงข้อความจากภาพโดยใช้ Python โดยจะมีข้อมูลเพื่อกำหนดสภาพแวดล้อมสำหรับการใช้ Aspose.OCR รายการขั้นตอนในการอธิบายขั้นตอนการทำงานของโปรแกรม และ โค้ด Python สำหรับดึงข้อความจากภาพ คุณจะได้เรียนรู้วิธีดึงข้อความจากภาพ PNG/JPEG/PDF/TIFF/GIF/BMP เดี่ยว หรือจากคอลเล็กชันภาพในไดเรกทอรี
ขั้นตอนในการแยกข้อความจากภาพใน Python
- ตั้งค่าสภาพแวดล้อมสำหรับการใช้ Aspose.OCR for Python via .NET เพื่อดึงข้อความจากรูปภาพ
- สร้างวัตถุของคลาส AsposeOcr เพื่ออ่านข้อความ
- สร้างวัตถุของคลาสคอลเลกชัน OcrInput สำหรับการเพิ่มรูปภาพ
- ตั้งค่าชนิดอินพุต Ocr เป็น DIRECTORY
- เพิ่มเส้นทางไดเรกทอรีหนึ่งรายการหรือมากกว่าลงในคอลเลคชันรูปภาพ
- เรียกใช้เมธอด extractTextFromImage() โดยระบุอ็อบเจ็กต์ OcrInput
- แสดงข้อความทั้งหมดที่แยกออกมาบนคอนโซล
ขั้นตอนเหล่านี้อธิบายถึง โปรแกรม Python ที่ใช้ในการแยกข้อความจากรูปภาพ สร้างอ็อบเจ็กต์ของคลาส AsposeOcr อ็อบเจ็กต์ OcrInput เพื่อรักษาคอลเล็กชันของรูปภาพ ตั้งค่ารายการรูปภาพในคอลเล็กชัน และเรียกใช้เมธอด perceive() เพื่ออ่านข้อความ ในที่สุด ข้อความที่รับรู้จะแสดงทีละรายการโดยการวิเคราะห์คอลเล็กชันที่ส่งคืนจากเมธอด perceive()
โค้ดสำหรับดึงข้อความจากภาพโดยใช้ OCR ใน Python
import aspose.ocr as api | |
from aspose.ocr import License | |
# Instantiate a license | |
license = License() | |
license.set_license("License.lic") | |
extractTextFromImage = api.AsposeOcr() | |
imageDatas = api.OcrInput(api.InputType.DIRECTORY) | |
imageDatas.add("/Users/myuser/Images/") | |
textExtractedFromImage = extractTextFromImage.recognize(imageDatas) | |
length = textExtractedFromImage.length | |
for i in range(length): | |
print(textExtractedFromImage[i].recognition_text) |
โค้ดนี้สาธิตการ แยกข้อความจากรูปภาพโดยใช้ Python คุณสามารถตั้งค่าประเภทอินพุตเป็น SINGLE_IMAGE, PDF, TIFF, URL, ZIP เป็นต้น ตามความต้องการของคุณ คุณสามารถเพิ่มเส้นทางไดเรกทอรีหรือเส้นทางรูปภาพหลายเส้นทางได้โดยใช้เมธอด add() ในคลาส OcrInput
บทความนี้สอนเราเกี่ยวกับกระบวนการ ดึงข้อมูลจากภาพโดยใช้ Python หากต้องการอ่านภาพลายมือ โปรดอ่านบทความที่ แปลงลายมือเป็นข้อความโดยใช้ Python