Tekst in PDF zoeken en vervangen met Python

Deze korte zelfstudie helpt bij hoe je tekst in PDF kunt vinden en vervangen met behulp van Python. Het bevat informatie over het configureren van de IDE, een stapsgewijs gedetailleerd proces en een uitvoerbare voorbeeldcode om een woord in pdf te vinden en te vervangen met behulp van Python. Je leert ook de opties om tekst te zoeken en te vervangen op alle pagina’s van een PDF of op een bepaalde pagina volgens de toepassingsvereisten.

Stappen om in PDF te zoeken en te vervangen met behulp van Python

  1. Stel de omgeving in op gebruik Aspose.PDF voor Python via .NET om de tekst te vervangen
  2. Laad het doel-pdf-bestand met behulp van het Document-klassenobject waar gegevens moeten worden doorzocht en vervangen
  3. Definieer de tekst die moet worden doorzocht met behulp van het klasseobject TextFragmentAbsorber
  4. Pas de TextAbsorber toe op alle pagina’s in de PDF met behulp van de methode Document.pages.accept().
  5. Krijg toegang tot de verzameling van alle gezochte items in de PDF via de eigenschap TextFragmentAbsorber.text_fragments
  6. Herhaal alle doorzochte tekstfragmenten en stel nieuwe waarden in volgens uw vereisten
  7. Sla het bijgewerkte PDF-bestand op de schijf op met bijgewerkte tekst

Deze stappen vatten het proces samen om alles in PDF te vinden en te vervangen met behulp van Python. Een TextFragmentAbsorber-object wordt gedeclareerd door een tekenreeks op te geven die moet worden doorzocht en vervolgens wordt de methode Document.pages.accept() aangeroepen om alle pagina’s in de PDF te ontleden en de tekstfragmenten te verzamelen die het doelwoord bevatten. Zodra de verzameling gevonden woorden klaar is, kunt u nu alle of geselecteerde fragmenten vervangen door de nieuwe woorden volgens uw behoeften.

Code om tekst in PDF te zoeken en te vervangen met behulp van Python

Deze code demonstreert het proces om de functie PDF-zoeken en tekst vervangen met behulp van Python te implementeren. Deze code heeft de methode Document.pages.accept() gebruikt om tekst in de gehele PDF te doorzoeken. Als u echter alleen tekst op een bepaalde pagina wilt zoeken en vervangen, kunt u de pagina selecteren door de pagina-index op te geven in de Document.pages-collectie en roep vervolgens de methode Page.accept() aan. U kunt ook het klasseobject TextSearchOptions als tweede argument gebruiken bij het instantiëren van het object TextFragmentAbsorber om de zoekbewerking aan te passen.

Dit artikel heeft ons geleerd om tekst in een pdf te zoeken en te vervangen. Als je het proces wilt leren om een tekst in een pdf te vinden en te markeren, raadpleeg dan het artikel op hoe te markeren in PDF met behulp van Python.

 Nederlands