Как да намерите и замените текст в PDF с помощта на Python

Този бърз урок ръководи как да намерите и замените текст в PDF с помощта на Python. Той съдържа информация за конфигуриране на IDE, поетапен подробен процес и изпълним примерен код за намиране и заместване на дума в pdf с помощта на Python. Ще научите и опциите за търсене и замяна на текст на всички страници на PDF или на определена страница според изискванията на приложението.

Стъпки за намиране и замяна в PDF с помощта на Python

  1. Задайте средата на използвайте Aspose.PDF за Python чрез .NET, за да замените текста
  2. Заредете целевия PDF файл, като използвате обекта от клас Document, където данните трябва да се търсят и заменят
  3. Дефинирайте текста, който ще се търси, като използвате обекта от клас TextFragmentAbsorber
  4. Приложете TextAbsorber за всички страници в PDF чрез метода Document.pages.accept().
  5. Получете достъп до колекцията от всички търсени елементи в PDF чрез свойството TextFragmentAbsorber.text_fragments
  6. Прегледайте всички търсени текстови фрагменти и задайте нови стойности според вашите изисквания
  7. Запазете актуализирания PDF файл на диска с актуализиран текст

Тези стъпки обобщават процеса за намиране и замяна на всичко в PDF с помощта на Python. Обектът TextFragmentAbsorber се декларира чрез предоставяне на низ, който трябва да се търси, след което се извиква методът Document.pages.accept(), за да анализира всички страници в PDF файла и да събере текстовите фрагменти, съдържащи целевата дума. След като колекцията от намерени думи е готова, сега можете да замените всички или избрани фрагменти с новите думи според вашите нужди.

Код за намиране и замяна на текст в PDF с помощта на Python

Този код демонстрира процеса за прилагане на функцията за PDF търсене и замяна на текст с помощта на Python. Този код е използвал метода Document.pages.accept() за търсене на текст в целия PDF файл, но ако искате да търсите и замените текст само на определена страница, можете да изберете страницата, като предоставите индекса на страницата в колекцията Document.pages и след това извикайте метода Page.accept(). Можете също така да използвате обект на клас TextSearchOptions като втори аргумент, докато инстанцирате обекта TextFragmentAbsorber, за да персонализирате операцията за търсене.

Тази статия ни научи да намираме и заместваме текст в PDF. Ако искате да научите процеса за намиране и маркиране на текст в PDF, вижте статията на как да маркирате в PDF с помощта на Python.

 Български