استخراج داده از فاکتورها با استفاده از پایتون

این آموزش نحوه انجام استخراج داده ها از فاکتورها با استفاده از Python را راهنمایی می کند. تمام جزئیات برای تنظیم IDE برای توسعه، لیستی از مراحل تعریف جریان برنامه و یک کد نمونه که نرم افزار فاکتور OCR را با استفاده از پایتون نشان می دهد، دارد. شما یاد خواهید گرفت که فرآیند تشخیص را از تصاویری مانند PNG، JPEG، BMP، TIFF و GIF مطابق با نیاز خود سفارشی کنید.

مراحل OCR فاکتور با استفاده از پایتون

  1. محیط را طوری تنظیم کنید که از Aspose.OCR for Python via .NET برای استخراج داده های فاکتور استفاده کند
  2. یک نمونه از Aspose.Ocr برای پردازش OCR ایجاد کنید
  3. یک نمونه از کلاس OcrInput برای نگهداری رسیدها ایجاد کنید
  4. رسیدها را به مجموعه OcrInput اضافه کنید
  5. تنظیمات تشخیص رسید را تنظیم کنید و زبان تشخیص را تنظیم کنید
  6. OCR را با استفاده از روش recognize_receipt برای تشخیص متن از رسیدهای ورودی انجام دهید
  7. نمایش متن شناخته شده از رسید

در این مراحل نحوه اعمال OCR برای رسیدها با استفاده از پایتون توضیح داده شده است. یک نمونه از شی Aspose.Ocr ایجاد کنید، شی OcrInput را برای نگهداری رسیدها مقداردهی کنید، و شی ReceiptRecognitionSettings را برای تعریف پارامترهای OCR فاکتورها ایجاد کنید. در نهایت، با ارائه لیست رسیدها و تنظیمات برای استخراج متن، متد ()شناسایی_receipt را فراخوانی کنید.

کد استخراج داده های فاکتور با استفاده از پایتون

import aspose.ocr as api
from aspose.ocr import License
# Instantiate and apply the license for Aspose.OCR to enable full functionality.
license = License()
license.set_license("License.lic")
# Create an instance of the Aspose.Ocr class for OCR processing.
extractTextFromReceipt = api.AsposeOcr()
# Initialize an OcrInput object to hold input image(s) for OCR processing.
receiptDatas = api.OcrInput(api.InputType.SINGLE_IMAGE)
# Add images (receipts) to the OcrInput object for recognition.
receiptDatas.add("Receipt1.png")
receiptDatas.add("Receipt2.png")
# Set up receipt recognition settings.
recognitionSettings = api.ReceiptRecognitionSettings()
recognitionSettings.language = api.Language.ENG # Specify the language as English.
# Perform OCR to recognize text from the input receipts using the specified settings.
results = extractTextFromReceipt.recognize_receipt(receiptDatas, recognitionSettings)
# Get the number of recognized results (one result per input image).
length = results.length
# Loop through each result and print the recognized text for each input image.
for i in range(length):
print(results[i].recognition_text)

این کد نمونه استفاده از invoice OCR API با استفاده از Python را نشان می دهد. می‌توانید نوع ورودی را روی PDF، TIFF، URL، Directory، Zip و غیره تنظیم کنید، و زبان تشخیص را از فهرست بزرگی از نام‌های زبان در شمارشگر زبان تنظیم کنید، کلاس ReceiptRecognitionSettings حاوی تعدادی ویژگی مانند تنظیم مجموعه کاراکترهای مجاز است. ، برای تنظیم وارونگی خودکار رنگ و تعیین یک لیست سیاه از کاراکترها برای نادیده گرفتن آنها پرچم گذاری کنید.

این مقاله فرآیند استخراج متن فاکتور را به ما آموزش داده است. برای تبدیل متن دست نویس به متن قابل ویرایش و جستجو، به مقاله در با استفاده از پایتون دست خط را به متن تبدیل کنید مراجعه کنید.

 فارسی