Извлечение ссылок из PDF с помощью C#

В этой статье рассказывается, как извлечь ссылки из PDF с помощью C#. В ней есть настройки IDE, шаги и пример кода для разработки экстрактора ссылок PDF с помощью C#. Вы научитесь извлекать выбранные аннотации со страницы и извлекать URI из аннотаций типа ссылки.

Шаги по извлечению URL из PDF с помощью C#

  1. Настройте IDE на использование Aspose.PDF for .NET для извлечения URI из страницы PDF
  2. Загрузите исходный PDF-файл file и просмотрите все его страницы.
  3. Создайте annotation selector для поиска ссылок-аннотаций на странице
  4. Извлечь все аннотации и получить список выбранных аннотаций
  5. Просмотрите каждую аннотацию ссылки и найдите связанные с ней действия.
  6. Применить действие к GoToURIAction для доступа и отображения URI

Эти шаги описывают, как извлечь гиперссылки из PDF с помощью C#. Создайте селектор аннотаций для аннотаций ссылок и используйте его для выбора списка целевых аннотаций. Приведите каждую аннотацию ссылки к GoToURIAction и извлеките URI из этого действия.

Код для извлечения гиперссылки из PDF с использованием C#

Приведенный выше код демонстрирует, как извлечь все ссылки из PDF с помощью C#. AnnotationSelector принимает объект LinkAnnotation, которому требуются страница и объект прямоугольника. Метод Accept() в классе Page принимает объект селектора ссылок и сохраняет аннотации ссылок в коллекции Selected.

Этот краткий урок научил нас процессу извлечения гиперссылок из страницы PDF. Чтобы удалить гиперссылки из файла PDF, обратитесь к статье Как удалить гиперссылку из PDF в C#.

 Русский