Čitanje različitih vrsta dokumenata programski je uobičajena praksa ovih dana. U ovom vodiču s uputama naučit ćete kako čitati datoteku PDF u C# slijedeći jednostavne korake u nastavku.
Koraci za čitanje PDF datoteke u C#
- Stvorite praznu C# konzolnu aplikaciju u Visual Studiju
- Dodajte referencu na Aspose.PDF for .NET instaliranjem s NuGet.org
- Učitaj postojeću PDF datoteku u objekt dokumenta
- Inicijalizirajte TextAbsorber klasu za čitanje PDF datoteke
- Ekstrahirajte PDF tekst i zapišite ga u izlaz konzole
- Iterirajte PDF stranicu Resources da pronađete slike
- Stvorite objekt FileStream s pronađenom slikom
- Spremite sliku na lokalni disk
Donji isječak koda objašnjava kako otvoriti i čitati PDF datoteku u C#. Pomoću njega moći ćete čitati tekst i izdvajati slike iz PDF datoteke. API nudi klasu TextAbsorber koja se koristi za čitanje teksta iz PDF datoteke, a ekstrahirane rezultate možete postići putem objekta Text. Pronalaženje slika i njihovo spremanje na lokalni disk također je moguće pretragom resursa PDF stranice kao što je prikazano u nastavku.
Kod za čitanje PDF datoteke u C#
U prethodnoj temi ste naučili kako obraditi velike PDF datoteke u C#. Gornje informacije i primjer koda omogućit će vam otvaranje i čitanje PDF datoteka u C# kako biste izdvojili tekst i slike.