Як знайти та замінити текст у PDF за допомогою Python

У цьому короткому посібнику описано, як знайти та замінити текст у PDF за допомогою Python. Він містить інформацію про налаштування IDE, поетапний детальний процес і приклад коду для пошуку та заміни слова в pdf за допомогою Python. Ви також дізнаєтесь про параметри пошуку та заміни тексту на всіх сторінках PDF або на окремій сторінці відповідно до вимог програми.

Кроки пошуку та заміни в PDF за допомогою Python

  1. Щоб замінити текст, установіть середовище використовуйте Aspose.PDF для Python через .NET
  2. Завантажте цільовий файл PDF за допомогою об’єкта класу Document, у якому потрібно шукати та замінювати дані
  3. Визначте текст, який потрібно шукати, використовуючи об’єкт класу TextFragmentAbsorber
  4. Застосуйте TextAbsorber до всіх сторінок PDF-файлу за допомогою методу Document.pages.accept().
  5. Отримайте доступ до колекції всіх шуканих елементів у PDF через властивість TextFragmentAbsorber.text_fragments
  6. Перегляньте всі пошукові фрагменти тексту та встановіть нові значення відповідно до ваших вимог
  7. Збережіть оновлений файл PDF на диску з оновленим текстом

Ці кроки підсумовують процес пошуку та заміни всього в PDF за допомогою Python. Об’єкт TextFragmentAbsorber оголошується шляхом надання рядка, який потрібно шукати, а потім викликається метод Document.pages.accept() для аналізу всіх сторінок у PDF-файлі та збору фрагментів тексту, що містять цільове слово. Коли колекція знайдених слів буде готова, тепер ви можете замінити всі або вибрані фрагменти новими словами відповідно до ваших потреб.

Код для пошуку та заміни тексту в PDF за допомогою Python

Цей код демонструє процес реалізації функції пошуку PDF і заміни тексту за допомогою Python. У цьому коді використовується метод Document.pages.accept() для пошуку тексту в усьому PDF-файлі, однак якщо ви хочете шукати та замінювати текст лише на певній сторінці, ви можете вибрати сторінку, надавши індекс сторінки в колекції Document.pages а потім викликайте метод Page.accept(). Ви також можете використовувати об’єкт класу TextSearchOptions як другий аргумент під час створення об’єкта TextFragmentAbsorber для налаштування операції пошуку.

Ця стаття навчила нас знаходити та замінювати текст у PDF. Якщо ви хочете дізнатися, як знайти та виділити текст у PDF-файлі, перегляньте статтю як виділити в PDF за допомогою Python.

 Українська