Четенето на различни типове документи програмно е обичайна практика в наши дни. В това ръководство с инструкции ще научите как да четете файл PDF в C#, като следвате простите стъпки по-долу.
Стъпки за четене на PDF файл в C#
- Създайте празно C# конзолно приложение във Visual Studio
- Добавете препратка към Aspose.PDF for .NET, като я инсталирате от NuGet.org
- Заредете съществуващ PDF файл в обект Document
- Инициализирайте клас TextAbsorber за четене на PDF файл
- Извлечете PDF текст и го запишете в изхода на конзолата
- Прегледайте PDF страницата Resources, за да намерите изображения
- Създайте FileStream обект с намерено изображение
- Запазете изображението на локален диск
Кодовият фрагмент по-долу обяснява как да отворите и прочетете PDF файл в C#. Ще можете да четете текст и да извличате изображения от PDF файл, като го използвате. API предлага клас TextAbsorber, който се използва за четене на текст от PDF файл и можете да постигнете извлечените резултати чрез обект Text. Намирането на изображения и запазването им на локален диск също е възможно чрез циклично преминаване през ресурсите на PDF страницата, както е показано по-долу.
Код за четене на PDF файл в C#
В предишната тема научихте как да обработвате големи PDF файлове в C#. Горната информация и примерен код ще ви позволят да отваряте и четете PDF файлове в C#, за да извличате текст и изображения.