Hur man hittar och ersätter text i PDF med Python

Den här snabba handledningsguiden om hur du hittar och ersätter text i PDF med Python. Den innehåller information om att konfigurera IDE, en stegvis detaljerad process och en körbar exempelkod för att hitta och ersätta word i pdf med Python. Du kommer också att lära dig alternativen för att söka och ersätta text på alla sidor på en PDF eller på en viss sida enligt applikationskraven.

Steg för att hitta och ersätta i PDF med Python

  1. Ställ in miljön på använd Aspose.PDF för Python via .NET för att ersätta texten
  2. Ladda mål-PDF-filen med klassobjektet Document där data ska sökas och ersättas
  3. Definiera texten som ska sökas med hjälp av klassobjektet TextFragmentAbsorber
  4. Använd TextAbsorber för alla sidor i PDF:en med metoden Document.pages.accept()
  5. Få tillgång till samlingen av alla sökta objekt i PDF-filen genom egenskapen TextFragmentAbsorber.text_fragments
  6. Gå igenom alla sökta textfragment och ställ in nya värden enligt dina krav
  7. Spara den uppdaterade PDF-filen på disken med uppdaterad text

Dessa steg sammanfattar processen för att hitta och ersätta allt i PDF med Python. Ett TextFragmentAbsorber-objekt deklareras genom att tillhandahålla en sträng som ska sökas och sedan anropas metoden Document.pages.accept() för att analysera alla sidor i PDF:en och samla in textfragmenten som innehåller målordet. När samlingen av hittade ord är klar kan du nu ersätta alla eller valda fragment med de nya orden enligt dina behov.

Kod för att hitta och ersätta text i PDF med Python

Den här koden demonstrerar processen för att implementera funktionen för PDF-sökning och ersätt text med Python. Den här koden har använt metoden Document.pages.accept() för att söka text i hela PDF-filen, men om du bara vill söka och ersätta text på en viss sida kan du välja sidan genom att tillhandahålla sidindexet i Document.pages-samlingen och anropa sedan Page.accept()-metoden. Du kan också använda klassobjektet TextSearchOptions som ett andra argument medan du instansierar TextFragmentAbsorber-objektet för att anpassa sökoperationen.

Den här artikeln har lärt oss att hitta och ersätta text i en PDF. Om du vill lära dig processen för att hitta och markera en text i en PDF, se artikeln om hur man markerar i PDF med Python.

 Svenska