Denna handledning guider om hur du utför dataextraktion från fakturor med Python. Den har alla detaljer för att ställa in IDE för utvecklingen, en lista med steg som definierar programflödet och en exempelkod som demonstrerar invoice OCR-programvaran med Python. Du kommer att lära dig att anpassa detekteringsprocessen från bilder som PNG, JPEG, BMP, TIFF och GIF enligt dina krav.

Steg för faktura-OCR med Python

Ställ in miljön att använda Aspose.OCR for Python via .NET för att extrahera fakturadata
Skapa en instans av Aspose.Ocr för OCR-bearbetning
Skapa en instans av klassen OcrInput för att lagra kvitton
Lägg till kvitton i OcrInput-samlingen
Ställ in inställningar för kvittotigenkänning och ställ in igenkänningsspråk
Utför OCR med metoden recognize_receipt för att känna igen text från inmatningskvitton
Visa igenkänd text från kvitton

Dessa steg beskriver hur du tillämpar OCR för kvitton med Python. Skapa en instans av Aspose.Ocr-objektet, initiera OcrInput-objektet för att hålla kvitton och skapa ReceiptRecognitionSettings-objektet för att definiera parametrarna för fakturornas OCR. Till sist, anropa metoden identifi_receipt() genom att tillhandahålla kvittolistan och inställningar för att extrahera texten.

Kod för utvinning av fakturadata med Python

Den här exempelkoden visar användningen av invoice OCR API med Python. Du kan ställa in inmatningstypen till PDF, TIFF, URL, Directory, Zip etc., och ställa in detekteringsspråk från en stor lista med språknamn i språkuppräkningen. Klassen ReceiptRecognitionSettings innehåller ett antal egenskaper som att ställa in tillåtna teckenuppsättningar , flagga för att ställa in automatisk färginversion och definiera en svart lista med tecken för att ignorera dem.

Den här artikeln har lärt oss processen att extrahera fakturatext. För att konvertera handskriven text till redigerbar och sökbar text, se artikeln om Konvertera handstil till text med Python.

Aspose Kunskapsbas

Hitta svar med API

Dataextraktion från fakturor med Python

Steg för faktura-OCR med Python

Kod för utvinning av fakturadata med Python