В этом кратком руководстве описывается, как найти и заменить текст в PDF с помощью C#, с подробными инструкциями и исполняемым кодом. Он помогает настроить среду, а затем предоставляет пошаговый процесс замены текста в PDF-файле с помощью C#. После обновления файла вы можете сохранить его обратно на диск в исходном формате, т.е. PDF или как DOCX, Excel, HTML и т. д. и т. д.
Действия по поиску и замене текста в PDF с помощью С#
- Настройте проект для использования Aspose.PDF for .NET с помощью диспетчера пакетов NuGet.
- Создайте или загрузите файл PDF, содержащий образец текста, с помощью объекта класса Document.
- Используя объект класса TextFragmentAbsorber, задайте текст для поиска
- Для всех страниц входного PDF-файла примите поглотитель текста.
- Получить набор фрагментов, где текст извлечен из загруженного PDF-файла
- Проанализируйте все фрагменты и установите новый текст
- Сохраните обновленный файл PDF
Эти шаги описывают, как в PDF искать и заменять текст с помощью C#. Создается новый файл с образцом текста, однако вы можете загрузить существующий файл PDF, текст которого необходимо заменить. Существует множество вариантов поиска текста в PDF, таких как игнорирование теневого текста, ограничение поиска привязкой к странице и т. д.
Код для замены текста в PDF с помощью С#
Этот код использует TextFragmentAbsorber и TextFragment для поиска и замены текста в PDF с помощью C#. Вы можете не только заменить текст, но и изменить его семейство шрифтов, размер, цвет переднего плана и цвет фона в результирующем файле PDF. Также доступны параметры для замены текста сразу во всем PDF-файле или замены текста на основе регулярного выражения.
В этом разделе мы научились находить и заменять текст в PDF, однако, если вы хотите научиться разбивать PDF-файлы по страницам, обратитесь к статье как разбить файл PDF по страницам в С#.