Dieses Tutorial erklärt, wie Sie Datenextraktion aus Rechnungen mit Python durchführen. Es enthält alle Details zum Einrichten der IDE für die Entwicklung, eine Liste von Schritten, die den Programmablauf definieren, und einen Beispielcode, der die Rechnungs-OCR-Software mit Python demonstriert. Sie lernen, den Erkennungsprozess von Bildern wie PNG, JPEG, BMP, TIFF und GIF nach Ihren Anforderungen anzupassen.
Schritte zur Rechnungs-OCR mit Python
- Legen Sie die Umgebung so fest, dass Aspose.OCR for Python via .NET zum Extrahieren von Rechnungsdaten verwendet wird.
- Erstellen Sie eine Instanz von Aspose.Ocr für die OCR-Verarbeitung
- Erstellen Sie eine Instanz der OcrInput-Klasse zum Aufbewahren von Belegen
- Belege zur OcrInput-Sammlung hinzufügen
- Einrichten der Belegerkennungseinstellungen und Festlegen der Erkennungssprache
- Führen Sie OCR mit der Methode recognize_receipt durch, um Text aus den Eingabebelegen zu erkennen
- Erkannten Text aus den Belegen anzeigen
Diese Schritte beschreiben, wie Sie OCR für Quittungen mit Python anwenden. Erstellen Sie eine Instanz des Aspose.Ocr-Objekts, initialisieren Sie das OcrInput-Objekt zum Aufbewahren von Quittungen und erstellen Sie das ReceiptRecognitionSettings-Objekt zum Definieren der Parameter für die OCR der Rechnungen. Rufen Sie abschließend die Methode recognize_receipt() auf, indem Sie die Quittungsliste und die Einstellungen zum Extrahieren des Textes angeben.
Code zur Rechnungsdatenextraktion mit Python
import aspose.ocr as api | |
from aspose.ocr import License | |
# Instantiate and apply the license for Aspose.OCR to enable full functionality. | |
license = License() | |
license.set_license("License.lic") | |
# Create an instance of the Aspose.Ocr class for OCR processing. | |
extractTextFromReceipt = api.AsposeOcr() | |
# Initialize an OcrInput object to hold input image(s) for OCR processing. | |
receiptDatas = api.OcrInput(api.InputType.SINGLE_IMAGE) | |
# Add images (receipts) to the OcrInput object for recognition. | |
receiptDatas.add("Receipt1.png") | |
receiptDatas.add("Receipt2.png") | |
# Set up receipt recognition settings. | |
recognitionSettings = api.ReceiptRecognitionSettings() | |
recognitionSettings.language = api.Language.ENG # Specify the language as English. | |
# Perform OCR to recognize text from the input receipts using the specified settings. | |
results = extractTextFromReceipt.recognize_receipt(receiptDatas, recognitionSettings) | |
# Get the number of recognized results (one result per input image). | |
length = results.length | |
# Loop through each result and print the recognized text for each input image. | |
for i in range(length): | |
print(results[i].recognition_text) |
Dieser Beispielcode demonstriert die Verwendung der Rechnungs-OCR-API mit Python. Sie können den Eingabetyp auf PDF, TIFF, URL, Verzeichnis, Zip usw. einstellen und die Erkennungssprache aus einer großen Liste von Sprachennamen im Sprachen-Enumerator auswählen. Die Klasse ReceiptRecognitionSettings enthält eine Reihe von Eigenschaften, wie z. B. das Festlegen des zulässigen Zeichensatzes, ein Flag zum Festlegen der automatischen Farbumkehrung und das Definieren einer schwarzen Liste von Zeichen, die ignoriert werden sollen.
In diesem Artikel haben wir gelernt, wie man Rechnungstext extrahiert. Informationen zum Konvertieren von handschriftlichem Text in bearbeitbaren und durchsuchbaren Text finden Sie im Artikel zu Konvertieren Sie Handschrift mit Python in Text.