Hoe een PDF-bestand in Java te lezen

Deze korte zelfstudie begeleidt u bij hoe u een PDF-bestand in Java kunt lezen. Het bevat Java-code om het PDF-bestand te lezen, zodat u eerst de tekst van PDF in Java in een tekenreeks leest en vervolgens alle afbeeldingen uit het PDF-bestand ophaalt om ze op de schijf op te slaan als JPG. Het is niet nodig om een tool van derden te installeren om PDF in Java te lezen.

Stappen om PDF-bestanden in Java te lezen

  1. Configureer Aspose.PDF in uw project met behulp van de Maven-repository voor het lezen van het PDF-bestand
  2. Laad het voorbeeld-PDF-bestand in het Document klasseobject
  3. Instantieer TextAbsorber klasseobject dat volledige tekst uit het PDF-bestand kan lezen
  4. Lees PDF-tekst uit het geladen bestand met behulp van het klasseobject TextAbsorber
  5. Toon volledige tekst gelezen uit het PDF-bestand op de console
  6. Doorloop alle pagina’s in het PDF-bestand om toegang te krijgen tot de afbeeldingen
  7. Parseer alle afbeeldingen op elke pagina met afbeeldingen en sla ze op de schijf op

In deze snelle stapsgewijze zelfstudie laden we eerst het doel-PDF-bestand en starten vervolgens het TextAbsorber-klasseobject dat in staat is om tekst door alle pagina’s in de PDF te zoeken. Deze hele tekst wordt geretourneerd in een tekenreeks die kan worden weergegeven of verwerkt volgens de vereiste. Op dezelfde manier kunnen we alle afbeeldingen in de afbeeldingenverzameling ontleden en ze op de schijf opslaan in elk formaat zoals we het in deze zelfstudie als JPG hebben opgeslagen.

Code om PDF te lezen met Java

In deze voorbeeldcode hebben we de klasse TextAbsorber en de functie getImages() van Page.getResources() gebruikt om PDF te lezen met Java. TextAbsorber-object wordt gebruikt om tekst te lezen met de accept-functie in de PDF PageCollection. Terwijl de functie getImages() van de verzameling getResources() alle afbeeldingen op een pagina retourneert.

Merk op dat deze stappen om PDF in Java te lezen kunnen worden uitgevoerd in elk van de besturingssystemen zoals Windows, Linux of macOS. Als je meer wilt weten over het werken met PDF-bestanden, raadpleeg dan het artikel op bladwijzers in PDF lezen met Java.

 Nederlands