Denna korta handledning visar hur man konverterar skannad PDF till redigerbar PDF med Java. Den innehåller detaljer för att konfigurera IDE:n, en lista med steg och exempel kod för att konvertera skannad PDF till sökbar PDF med Java. Du får detaljer för att anpassa processen att skanna bild och konvertera innehåll till läsbar text.
Steg för att göra PDF läsbar med Java
- Ställ in IDE:n att använda Aspose.Total for Java för att omvandla en skannad PDF till en sökbar PDF
- Instansiera respektive produktlicenser för att undvika vattenmärken i utdata
- Skapa en instans av igenkänningsmotorn med klassen AsposeOCR
- Skapa inmatningsinstansen med OcrInput‑klassen och ladda den skannade PDF‑filen som källa i den.
- Skapa RecognitionSettings‑instansen för att ställa in parametrar för anpassningen under bildskanningen
- Anropa metoden AsposeOCR.Recognize() för att hämta data från den skannade PDF-filen och lagra den i en tillfällig PDF.
- Ladda den mellanliggande PDF-filen i Document-klassobjektet för Aspose.PDF och sätt metadata i den
- Spara den slutliga PDF-filen på disken med sökbar text och metadata
Dessa steg beskriver hur man konverterar PDF‑bild till PDF‑text med Java. Skapa ett igenkänningsmotorobjekt, förbered indatafilen genom att lägga till den skannade PDF-filen i OcrInput-objektet, definiera parametrarna i RecognitionSettings-objektet, anropa Recognize()-metoden för att skanna data och spara resultaten i en mellanliggande PDF-fil. Slutligen, ladda den mellanliggande PDF-filen med Aspose.PDF.Document-objektet och lägg till metadata eller formatera det ytterligare innan du sparar den slutliga PDF-filen.
Kod för att konvertera PDF-bild till text med Java
Den här koden visar hur man konverterar PDF till sökbar PDF med Java. Du kan ange ett specifikt detekteringsspråk när du skannar PDF-filen, sätta en flagga för att automatiskt upptäcka språket, begränsa igenkänning till specifika tecken eller svartlista tecken som du vill att OCR ska ignorera. Alternativ finns också för att välja strategi för detektering av källdokumentets område/layout om så krävs.
Den här artikeln har lärt oss hur man konverterar en PDF till en valbar text‑PDF. För att exportera data från ett PDF‑formulär till Excel, se artikeln Exportera data från ett PDF‑formulär till Excel med Java.