Tekst in PDF doorhalen met C#

In deze korte zelfstudie wordt uitgelegd hoe u tekst in PDF kunt doorhalen met C#. Het bevat informatie over alle benodigde bronnen, een stapsgewijs proces en een uitvoerbare voorbeeldcode om tekst in Adobe PDF door te halen met C#. Het deelt procesdetails, zoals het laden van het PDF-bestand, het zoeken naar doeltekst op de pagina en het vervolgens doorstrepen met de gewenste kleur.

Stappen om tekst in PDF door te halen met C#

  1. Breng de omgeving tot stand om Aspose.PDF for .NET toe te voegen om tekst in PDF door te halen
  2. Laad het doel-PDF-bestand met wat voorbeeldtekst erin met behulp van het Document klasse-object
  3. Declareer een TextFragmentAbsorber klasse-object door de doeltekst op te geven om te zoeken
  4. Parseer de gewenste pagina en vind alle tekstfragmenten erin
  5. Maak een StrikeOutAnnotation-object om de doeltekstfragmenten op de pagina door te halen
  6. Voeg deze annotatie toe aan de annotatieverzameling op de pagina en sla de pdf op

Deze stappen beschrijven hoe u kunt doorhalen in Adobe Acrobat met behulp van C#. Alle belangrijke klassen, methoden en eigenschappen worden geïdentificeerd en gebruikt in een goed gedefinieerde volgorde om de gewenste uitvoer te bereiken, zoals de klasse Document wordt gebruikt voor het laden van het pdf-bestand, de klasse TextFragmentAbsorber wordt gebruikt voor het zoeken naar de gewenste tekst in de pdf, de klasse StrikeOutAnnotation class wordt gebruikt om een doorgestreepte annotatie voor de tekst te maken en vervolgens wordt deze annotatie toegevoegd aan de verzameling annotaties van de geselecteerde pagina.

Code om tekst in PDF door te halen met C#

De bovenstaande code demonstreert hoe tekst in Adobe PDF kan worden doorgehaald met C#. Het gebruikt het klasseobject TextFragmentAbsorber dat een object maakt voor het uitvoeren van een zoekopdracht die verder wordt gebruikt om de tekst op de eerste pagina van het doel-PDF-bestand te doorzoeken. Zodra de verzameling tekstfragmenten is verkregen met behulp van de methode TextFragmentAbsorber.Visit(), zijn we nu klaar om een StrikeOutAnnotation-object te maken voor elk van de tekstfragmenten door de titel en kleur van de annotatie op te geven.

Deze tutorial heeft ons geholpen om bepaalde tekst in een PDF te verwijderen. Als je het proces wilt leren om een tekst in een pdf te markeren, raadpleeg dan het artikel op tekst zoeken en markeren in PDF met C#.

 Nederlands