Программное чтение различных типов документов в наши дни является обычной практикой. В этом практическом руководстве вы научитесь читать файл PDF на C#, выполнив следующие простые шаги.

Шаги для чтения файла PDF в С#

Создайте пустое консольное приложение C# в Visual Studio
Добавьте ссылку на Aspose.PDF for .NET, установив его с NuGet.org.
Загрузите существующий файл PDF в объект документа
Инициализировать класс TextAbsorber для чтения файла PDF
Извлеките текст PDF и запишите его на вывод консоли
Просмотрите страницу PDF Resources, чтобы найти изображения.
Создать объект FileStream с найденным изображением
Сохраните изображение на локальный диск

Ниже приведен фрагмент кода, объясняющий, как открыть и прочитать PDF-файл на C#. С его помощью вы сможете читать текст и извлекать изображения из файла PDF. API предлагает класс TextAbsorber, который используется для чтения текста из файла PDF, и вы можете получить извлеченные результаты с помощью объекта Text. Поиск изображений и их сохранение на локальный диск также возможен путем циклического просмотра ресурсов страницы PDF, как показано ниже.

Код для чтения PDF-файла на С#

В предыдущем разделе вы узнали как обрабатывать большие файлы PDF в С#. Приведенная выше информация и пример кода позволят вам открывать и читать PDF-файлы на C# для извлечения текста и изображений.

Aspose База знаний

Найдите ответы API

Как читать PDF-файл в C#

Шаги для чтения файла PDF в С#

Код для чтения PDF-файла на С#