Витягніть посилання з PDF-файлу в Java

У цій короткій статті ви дізнаєтесь, як видобувати посилання з PDF у Java. Він містить налаштування IDE, список кроків і зразок коду для вилучення гіперпосилань із PDF-файлу в Java. Ви навчитеся отримувати анотації типу посилання та перетворювати їх на URIAction для отримання URI.

Кроки для вилучення URL-адреси з PDF-файлу в Java

  1. Налаштуйте IDE на використання Aspose.PDF for Java для отримання посилань
  2. Завантажте вихідний PDF file, перегляньте всі сторінки та створіть селектор анотацій для сторінки
  3. Витягніть усі анотації зі сторінки та збережіть їх у колекції Вибране
  4. Перегляньте всі анотації та приведіть кожну анотацію до GoToURIAction
  5. Викличте метод getURI(), щоб отримати доступ до посилання та відобразити його на консолі

У цьому посібнику показано, як витягти всі посилання з PDF-файлу в Java. Завантажте вихідний файл PDF, перейдіть до цільових сторінок і створіть селектор анотацій для кожної сторінки. Викличте метод accept() за допомогою визначеного селектора, отримайте список анотацій посилань і URI, привівши його до класу GoToURIAction.

Код для вилучення гіперпосилання з PDF у Java

Наведений вище код продемонстрував екстрактор посилань PDF у Java. Ви можете пропустити або вибрати сторінку, проаналізувавши її вміст за допомогою об’єкта класу Page під час повторного перегляду сторінок у PDF-файлі. Метод getAction() використовується для отримання дії URIAction, яка містить URI посилання.

У цій статті ми навчилися процесу отримання гіперпосилань із PDF-файлу. Щоб створити гіперпосилання у PDF-файлі, перегляньте статтю як створити гіперпосилання в PDF за допомогою Java.

 Українська