Как да намерите и замените текст в PDF с помощта на C#

Това кратко ръководство описва как да намерите и замените текст в PDF с помощта на C# с помощта на подробни стъпки и код, който може да се изпълнява. Той помага за конфигуриране на средата и след това предоставя стъпка по стъпка процес за замяна на текст в PDF с помощта на C#. След като файлът бъде актуализиран, можете да го запишете обратно на диска в оригиналния формат, т.е. PDF или като DOCX, Excel, HTML и т.н., за да назовем само няколко.

Стъпки за намиране и замяна на текст в PDF с помощта на C#

  1. Конфигурирайте проекта да използва Aspose.PDF for .NET с помощта на мениджъра на пакети NuGet
  2. Създайте или заредете PDF файл, съдържащ примерен текст, като използвате обекта на клас Document
  3. Използвайки обекта от клас TextFragmentAbsorber, задайте текста, в който да се търси
  4. За всички страници във входния PDF файл приемете абсорбера на текст
  5. Вземете колекцията от фрагменти, където текстът е извлечен от заредения PDF файл
  6. Анализирайте всички фрагменти и задайте нов текст
  7. Запазете актуализирания PDF файл

Тези стъпки описват как в PDF търсите и заменяте текст с помощта на C#. Създава се нов файл с примерен текст, но можете да заредите съществуващ PDF файл, чийто текст трябва да бъде заменен. Налични са различни опции за търсене на текст в PDF, като игнориране на текст в сянка, ограничаване на търсенето до обвързани страници и т.н.

Код за замяна на текст в PDF с помощта на C#

Този код използва TextFragmentAbsorber и TextFragment за текст за намиране и заместване в PDF с помощта на C#. Можете не само да замените текста, но и да промените неговото семейство шрифтове, размера, цвета на предния план и цвета на фона в получения PDF файл. Налични са и опции за замяна на текст в целия PDF наведнъж или за замяна на текст въз основа на регулярния израз.

В тази тема се научихме да намираме и заместваме текст в PDF, но ако искате да се научите да разделяте PDF файлове по страници, вижте статията на как да разделя PDF файл по страници в C#.

 Български