Това кратко ръководство описва как да намерите и замените текст в PDF с помощта на C# с помощта на подробни стъпки и код, който може да се изпълнява. Той помага за конфигуриране на средата и след това предоставя стъпка по стъпка процес за замяна на текст в PDF с помощта на C#. След като файлът бъде актуализиран, можете да го запишете обратно на диска в оригиналния формат, т.е. PDF или като DOCX, Excel, HTML и т.н., за да назовем само няколко.
Стъпки за намиране и замяна на текст в PDF с помощта на C#
- Конфигурирайте проекта да използва Aspose.PDF for .NET с помощта на мениджъра на пакети NuGet
- Създайте или заредете PDF файл, съдържащ примерен текст, като използвате обекта на клас Document
- Използвайки обекта от клас TextFragmentAbsorber, задайте текста, в който да се търси
- За всички страници във входния PDF файл приемете абсорбера на текст
- Вземете колекцията от фрагменти, където текстът е извлечен от заредения PDF файл
- Анализирайте всички фрагменти и задайте нов текст
- Запазете актуализирания PDF файл
Тези стъпки описват как в PDF търсите и заменяте текст с помощта на C#. Създава се нов файл с примерен текст, но можете да заредите съществуващ PDF файл, чийто текст трябва да бъде заменен. Налични са различни опции за търсене на текст в PDF, като игнориране на текст в сянка, ограничаване на търсенето до обвързани страници и т.н.
Код за замяна на текст в PDF с помощта на C#
Този код използва TextFragmentAbsorber и TextFragment за текст за намиране и заместване в PDF с помощта на C#. Можете не само да замените текста, но и да промените неговото семейство шрифтове, размера, цвета на предния план и цвета на фона в получения PDF файл. Налични са и опции за замяна на текст в целия PDF наведнъж или за замяна на текст въз основа на регулярния израз.
В тази тема се научихме да намираме и заместваме текст в PDF, но ако искате да се научите да разделяте PDF файлове по страници, вижте статията на как да разделя PDF файл по страници в C#.