Tekst in PDF doorhalen met Java

Deze korte zelfstudie beschrijft hoe u tekst in PDF kunt doorhalen met Java. Het bevat alle details om de omgeving te configureren en biedt een lopende voorbeeldcode om tekst in Adobe PDF door te halen met Java. Je leert het proces om een pdf te laden en een bepaalde instantie van een tekst of alle instanties in het geladen PDF-bestand door te halen.

Stappen om tekst in Adobe PDF door te halen met Java

  1. Stel de IDE in om Aspose.PDF for Java toe te voegen om een tekst door te halen
  2. Laad het doel-PDF-bestand met behulp van het Document-klassenobject en krijg toegang tot de doelpagina om tekst door te halen
  3. Maak een TextFragmentAbsorber-object voor het doorzoeken van een tekst
  4. Parseer het PDF-document om alle instanties van de gegeven tekst te doorzoeken en sla ze op in een verzameling
  5. Maak een StrikeOutAnnotation-object om een bepaald exemplaar van de tekst in het document door te halen
  6. Stel de annotatiekleur en titel in
  7. Sla het resulterende PDF-bestand op de schijf op met doorgestreepte tekst erin

In deze stappen wordt uitgelegd hoe tekst in Adobe PDF kan worden doorgehaald met Java. Alle noodzakelijke klassen, methoden en eigenschappen worden geïntroduceerd die nodig zijn om de taak uit te voeren, zoals de klasse Document die wordt gebruikt om het PDF-bestand te laden, het klasse-object TextFragmentAbsorber dat wordt gebruikt om een tekst in het PDF-bestand te definiëren en te doorzoeken, een StrikeOutAnnotation-object wordt gebruikt om de doorgestreepte annotatie te definiëren en toe te passen op een bepaalde instantie van de tekst. In deze stappen wordt ook het aanpassen van de doorgestreepte annotatie beschreven.

Code om tekst in PDF door te halen met Java

Deze code demonstreert hoe u kunt doorhalen in Adobe Acrobat met behulp van Java. Het initialiseert het TextFragmentAbsorber-object door de tekenreeksgegevens op te geven die op een bepaalde pagina in het PDF-bestand moeten worden doorzocht. Zodra de verzameling doorzochte tekstexemplaren gereed is, wordt een object StrikeOutAnnotation gemaakt door de PDF-doelpagina en de rechthoek op te geven voor de geselecteerde instantie van de tekst die moet worden doorgehaald. Op deze manier kunt u alleen de geselecteerde exemplaren van de zoektekst doorhalen of de hele verzameling doorzoeken en alle exemplaren doorhalen.

Dit artikel heeft ons een interessante functie geleerd om automatisch een bepaalde tekst op een enkele pagina of op alle pagina’s van een PDF-bestand door te halen. Als je meer wilt weten over het proces om tekst in pdf te zoeken en te vervangen, raadpleeg dan het artikel op hoe tekst in PDF te vinden en te vervangen met Java.

 Nederlands