Čtení různých typů dokumentů programově je v dnešní době běžnou praxí. V tomto návodu se naučíte, jak číst soubor PDF v C# pomocí níže uvedených jednoduchých kroků.
Kroky ke čtení souboru PDF v C#
- Vytvořte prázdnou aplikaci konzoly C# v sadě Visual Studio
- Přidejte odkaz na Aspose.PDF for .NET jeho instalací z NuGet.org
- Načtěte existující soubor PDF do objektu dokumentu
- Inicializujte třídu TextAbsorber pro čtení souboru PDF
- Extrahujte text PDF a zapište jej do výstupu konzoly
- Projděte si stránku PDF Resources a vyhledejte obrázky
- Vytvořte objekt FileStream s nalezeným obrázkem
- Uložte obraz na místní disk
Níže uvedený fragment kódu vysvětluje, jak otevřít a číst soubor PDF v C#. Pomocí něj budete moci číst text a extrahovat obrázky ze souboru PDF. API nabízí třídu TextAbsorber, která se používá ke čtení textu ze souboru PDF a extrahovaných výsledků můžete dosáhnout prostřednictvím objektu Text. Vyhledání obrázků a jejich uložení na místní disk je také možné procházením zdrojů stránky PDF, jak je znázorněno níže.
Kód pro čtení souboru PDF v C#
V předchozím tématu jste se dozvěděli jak zpracovat velké soubory PDF v C#. Výše uvedené informace a příklad kódu vám umožní otevírat a číst soubory PDF v C# za účelem extrahování textu a obrázků.