Szkennelt PDF konvertálása szerkeszthető PDF-re Java használatával

Ez a rövid útmutató bemutatja, hogyan konvertálhatja a beolvasott PDF szerkeszthető PDF-fé Java segítségével. Tartalmazza az IDE beállításának részleteit, egy lépésről‑lépésre útmutatót, valamint mintakódot a beolvasott PDF kereshető PDF-re konvertálásához Java-val. Részleteket kap a kép beolvasásának és a tartalom olvasható szöveggé alakításának testreszabásához.

Lépések a PDF olvashatóvá tételéhez Java‑val

  1. Állítsa be az IDE-t, hogy használja Aspose.Total for Java a beolvasott PDF-et kereshető PDF-re alakításához.
  2. Hozzon létre megfelelő terméklicenceket a kimenetben megjelenő vízjelek elkerülése érdekében.
  3. Hozzon létre egy példányt a felismerő motorból az AsposeOCR osztály segítségével
  4. Hozza létre a bemeneti példányt az OcrInput osztály segítségével, és töltse be a forrásként szolgáló beolvasott PDF-et.
  5. Hozza létre a RecognitionSettings példányt, hogy beállítsa a testreszabás paramétereit a képszkennelés során
  6. Hívja meg az AsposeOCR.Használja a Recognize() metódust, hogy adatokat nyerjen ki a beolvasott PDF‑ből, és egy ideiglenes PDF‑be mentse.
  7. Töltsd be a köztes PDF-et az Aspose‑be.PDF Document osztályobjektumába, és állítsd be a metaadatait.
  8. Mentse a végleges PDF-et a lemezen kereshető szöveggel és metaadatokkal

Ezek a lépések leírják, hogyan lehet PDF képet PDF szöveggé Java-val konvertálni. Hozzon létre egy felismerő motor objektumot, készítse elő a bemeneti fájlt úgy, hogy a beolvasott PDF fájlt hozzáadja az OcrInput objektumhoz, definiálja a paramétereket a RecognitionSettings objektumban, hívja meg a Recognize() metódust az adatok beolvasásához, és mentse az eredményeket egy köztes PDF fájlba. Végül töltse be a köztes PDF-fájlt az Aspose-be.PDF.Használjon Document objektumot, és adjon hozzá metaadatokat, vagy formázza tovább, mielőtt elmenti a végleges PDF-fájlt.

Kód a PDF-kép szöveggé konvertálásához Java-val

Ez a kód bemutatja, hogyan lehet PDF-et kereshető PDF-re konvertálni Java használatával. Beállíthat egy adott felismerési nyelvet a PDF beolvasása közben, beállíthat egy jelzőt az automatikus nyelvfelismeréshez, korlátozhatja a felismerést meghatározott karakterekre vagy feketelistázhatja azokat a karaktereket, amelyeket az OCR-nek figyelmen kívül kell hagynia. Szükség esetén lehetőség van a forrásdokumentum területének/layoutrendszerének felismerési stratégiájának kiválasztására is.

Ez a cikk bemutatta a folyamatot, hogyan konvertáljunk egy PDF-et választható szöveges PDF-be. A PDF űrlap adatait Excelbe exportáláshoz tekintse meg a PDF űrlap adatainak exportálása Excelbe Java-val cikket.

 Magyar