Как найти и заменить текст в PDF с помощью C#

В этом кратком руководстве описывается, как найти и заменить текст в PDF с помощью C#, с подробными инструкциями и исполняемым кодом. Он помогает настроить среду, а затем предоставляет пошаговый процесс замены текста в PDF-файле с помощью C#. После обновления файла вы можете сохранить его обратно на диск в исходном формате, т.е. PDF или как DOCX, Excel, HTML и т. д. и т. д.

Действия по поиску и замене текста в PDF с помощью С#

  1. Настройте проект для использования Aspose.PDF for .NET с помощью диспетчера пакетов NuGet.
  2. Создайте или загрузите файл PDF, содержащий образец текста, с помощью объекта класса Document.
  3. Используя объект класса TextFragmentAbsorber, задайте текст для поиска
  4. Для всех страниц входного PDF-файла примите поглотитель текста.
  5. Получить набор фрагментов, где текст извлечен из загруженного PDF-файла
  6. Проанализируйте все фрагменты и установите новый текст
  7. Сохраните обновленный файл PDF

Эти шаги описывают, как в PDF искать и заменять текст с помощью C#. Создается новый файл с образцом текста, однако вы можете загрузить существующий файл PDF, текст которого необходимо заменить. Существует множество вариантов поиска текста в PDF, таких как игнорирование теневого текста, ограничение поиска привязкой к странице и т. д.

Код для замены текста в PDF с помощью С#

Этот код использует TextFragmentAbsorber и TextFragment для поиска и замены текста в PDF с помощью C#. Вы можете не только заменить текст, но и изменить его семейство шрифтов, размер, цвет переднего плана и цвет фона в результирующем файле PDF. Также доступны параметры для замены текста сразу во всем PDF-файле или замены текста на основе регулярного выражения.

В этом разделе мы научились находить и заменять текст в PDF, однако, если вы хотите научиться разбивать PDF-файлы по страницам, обратитесь к статье как разбить файл PDF по страницам в С#.

 Русский