Převod naskenovaného PDF na editovatelné PDF pomocí Javy

Tento stručný tutoriál vás provede, jak převést naskenovaný PDF na editovatelný PDF pomocí Javy. Obsahuje podrobnosti o konfiguraci IDE, seznam kroků a ukázkový kód pro převod naskenovaného PDF na prohledávatelný PDF pomocí Javy. Získáte podrobnosti, jak přizpůsobit proces skenování obrazu a převodu obsahu na čitelný text.

Kroky pro vytvoření čitelného PDF pomocí Javy

  1. Nastavte IDE tak, aby používalo Aspose.Total for Java k převodu naskenovaného PDF na prohledávatelné PDF
  2. Zajistěte příslušné produktové licence, aby se v výstupu neobjevily vodoznaky.
  3. Vytvořte instanci rozpoznávacího enginu pomocí třídy AsposeOCR
  4. Vytvořte vstupní instanci pomocí třídy OcrInput a načtěte do ní zdrojový naskenovaný PDF.
  5. Vytvořte instanci RecognitionSettings pro nastavení parametrů přizpůsobení během skenování obrazu
  6. Zavolejte metodu AsposeOCR.Recognize() pro načtení dat ze skenovaného PDF a jejich uložení do dočasného PDF
  7. Načtěte mezilehlý PDF do objektu třídy Document knihovny Aspose.PDF a nastavte v něm metadata.
  8. Uložte finální PDF na disk s prohledávatelným textem a metadaty

Tento postup popisuje, jak převést PDF obrázek na PDF text pomocí Javy. Vytvořte objekt rozpoznávacího enginu, připravte vstupní soubor přidáním naskenovaného PDF souboru do objektu OcrInput, definujte parametry v objektu RecognitionSettings, zavolejte metodu Recognize() k načtení dat a uložte výsledky do mezilehlého PDF souboru. Nakonec načtěte mezilehlý PDF soubor pomocí objektu Aspose.PDF.Dokument a přidejte metadata nebo jej dále formátujte před uložením finálního PDF souboru.

Kód pro převod PDF obrázku na text pomocí Javy

Tento kód ukazuje, jak převést PDF na prohledávatelné PDF pomocí Javy. Můžete nastavit konkrétní jazyk detekce při skenování PDF, nastavit příznak pro automatické rozpoznání jazyka, omezit rozpoznávání na konkrétní znaky nebo zakázat znaky, které chcete, aby OCR ignorovalo. Také jsou k dispozici možnosti výběru strategie detekce oblasti/layoutu zdrojového dokumentu, pokud je to potřeba.

Tento článek nás naučil procesu převodu PDF na PDF s výběrným textem. Pro export dat z PDF formuláře do Excelu se podívejte na článek Exportovat data z PDF formuláře do Excelu pomocí Javy.

 Čeština