Ez a rövid útmutató bemutatja, hogyan konvertálhatja a beolvasott PDF szerkeszthető PDF-fé Java segítségével. Tartalmazza az IDE beállításának részleteit, egy lépésről‑lépésre útmutatót, valamint mintakódot a beolvasott PDF kereshető PDF-re konvertálásához Java-val. Részleteket kap a kép beolvasásának és a tartalom olvasható szöveggé alakításának testreszabásához.
Lépések a PDF olvashatóvá tételéhez Java‑val
- Állítsa be az IDE-t, hogy használja Aspose.Total for Java a beolvasott PDF-et kereshető PDF-re alakításához.
- Hozzon létre megfelelő terméklicenceket a kimenetben megjelenő vízjelek elkerülése érdekében.
- Hozzon létre egy példányt a felismerő motorból az AsposeOCR osztály segítségével
- Hozza létre a bemeneti példányt az OcrInput osztály segítségével, és töltse be a forrásként szolgáló beolvasott PDF-et.
- Hozza létre a RecognitionSettings példányt, hogy beállítsa a testreszabás paramétereit a képszkennelés során
- Hívja meg az AsposeOCR.Használja a Recognize() metódust, hogy adatokat nyerjen ki a beolvasott PDF‑ből, és egy ideiglenes PDF‑be mentse.
- Töltsd be a köztes PDF-et az Aspose‑be.PDF Document osztályobjektumába, és állítsd be a metaadatait.
- Mentse a végleges PDF-et a lemezen kereshető szöveggel és metaadatokkal
Ezek a lépések leírják, hogyan lehet PDF képet PDF szöveggé Java-val konvertálni. Hozzon létre egy felismerő motor objektumot, készítse elő a bemeneti fájlt úgy, hogy a beolvasott PDF fájlt hozzáadja az OcrInput objektumhoz, definiálja a paramétereket a RecognitionSettings objektumban, hívja meg a Recognize() metódust az adatok beolvasásához, és mentse az eredményeket egy köztes PDF fájlba. Végül töltse be a köztes PDF-fájlt az Aspose-be.PDF.Használjon Document objektumot, és adjon hozzá metaadatokat, vagy formázza tovább, mielőtt elmenti a végleges PDF-fájlt.
Kód a PDF-kép szöveggé konvertálásához Java-val
Ez a kód bemutatja, hogyan lehet PDF-et kereshető PDF-re konvertálni Java használatával. Beállíthat egy adott felismerési nyelvet a PDF beolvasása közben, beállíthat egy jelzőt az automatikus nyelvfelismeréshez, korlátozhatja a felismerést meghatározott karakterekre vagy feketelistázhatja azokat a karaktereket, amelyeket az OCR-nek figyelmen kívül kell hagynia. Szükség esetén lehetőség van a forrásdokumentum területének/layoutrendszerének felismerési stratégiájának kiválasztására is.
Ez a cikk bemutatta a folyamatot, hogyan konvertáljunk egy PDF-et választható szöveges PDF-be. A PDF űrlap adatait Excelbe exportáláshoz tekintse meg a PDF űrlap adatainak exportálása Excelbe Java-val cikket.