Это краткое руководство расскажет вам, как читать PDF-файл в Java. Он содержит код Java для чтения PDF-файла, так что сначала вы читаете текст из PDF на Java в строку, а затем извлекаете все изображения из PDF-файла, чтобы сохранить их на диске как JPG. Нет необходимости устанавливать какой-либо сторонний инструмент для чтения PDF на Java.

Шаги для чтения PDF-файла в Java

Настройте Aspose.PDF в своем проекте, используя репозиторий Maven для чтения PDF-файла.
Загрузите образец PDF-файла в объект класса Document.
Создайте объект класса TextAbsorber, который может читать весь текст из файла PDF.
Чтение текста PDF из загруженного файла с помощью объекта класса TextAbsorber
Отображение всего текста, прочитанного из файла PDF, на консоли
Переберите все страницы в файле PDF для доступа к изображениям.
Разобрать все изображения на каждой странице коллекции изображений и сохранить их на диск

В этом кратком пошаговом руководстве мы сначала загружаем целевой PDF-файл, а затем инициируем объект класса TextAbsorber, способный выполнять поиск текста по всем страницам в PDF-файле. Весь этот текст возвращается в виде строки, которую можно отобразить или обработать в соответствии с требованиями. Точно так же мы можем проанализировать все изображения в коллекции изображений и сохранить их на диске в любом формате, поскольку в этом руководстве мы сохранили его как JPG.

Код для чтения PDF с использованием Java

В этом примере кода мы использовали класс TextAbsorber и функцию getImages() из Page.getResources() для чтения PDF с помощью Java. Объект TextAbsorber используется для чтения текста функцией принятия в PDF PageCollection. В то время как функция getImages() коллекции getResources() возвращает все изображения на странице.

Обратите внимание, что эти шаги для чтения PDF на Java можно выполнить в любой из операционных систем, таких как Windows, Linux или macOS. Если вы хотите узнать больше о работе с файлами PDF, обратитесь к статье как читать закладки в PDF с помощью Java.

Aspose База знаний

Найдите ответы API

Как читать PDF-файл в Java

Шаги для чтения PDF-файла в Java

Код для чтения PDF с использованием Java