У цій короткій статті ви дізнаєтесь, як видобувати посилання з PDF у Java. Він містить налаштування IDE, список кроків і зразок коду для вилучення гіперпосилань із PDF-файлу в Java. Ви навчитеся отримувати анотації типу посилання та перетворювати їх на URIAction для отримання URI.
Кроки для вилучення URL-адреси з PDF-файлу в Java
- Налаштуйте IDE на використання Aspose.PDF for Java для отримання посилань
- Завантажте вихідний PDF file, перегляньте всі сторінки та створіть селектор анотацій для сторінки
- Витягніть усі анотації зі сторінки та збережіть їх у колекції Вибране
- Перегляньте всі анотації та приведіть кожну анотацію до GoToURIAction
- Викличте метод getURI(), щоб отримати доступ до посилання та відобразити його на консолі
У цьому посібнику показано, як витягти всі посилання з PDF-файлу в Java. Завантажте вихідний файл PDF, перейдіть до цільових сторінок і створіть селектор анотацій для кожної сторінки. Викличте метод accept() за допомогою визначеного селектора, отримайте список анотацій посилань і URI, привівши його до класу GoToURIAction.
Код для вилучення гіперпосилання з PDF у Java
Наведений вище код продемонстрував екстрактор посилань PDF у Java. Ви можете пропустити або вибрати сторінку, проаналізувавши її вміст за допомогою об’єкта класу Page під час повторного перегляду сторінок у PDF-файлі. Метод getAction() використовується для отримання дії URIAction, яка містить URI посилання.
У цій статті ми навчилися процесу отримання гіперпосилань із PDF-файлу. Щоб створити гіперпосилання у PDF-файлі, перегляньте статтю як створити гіперпосилання в PDF за допомогою Java.