So lesen Sie eine PDF-Tabelle in Java

Dieses Tutorial enthält Details zum Lesen von PDF-Tabellen in Java und zum Zugreifen auf Text, der zu jeder Zelle in der gewünschten Tabelle gehört. Sie haben die volle Kontrolle, um auf eine bestimmte Tabelle auf der Zielseite von PDF zu verweisen und alle Zeilen und Zellen zu analysieren, um die Daten abzurufen. Um diesen PDF-Tabellenleser in Java zu schreiben, ist kein weiteres Tool oder Software von Drittanbietern erforderlich.

Schritte zum Lesen der PDF-Tabelle in Java

  1. Konfigurieren Sie Ihre Anwendung zum Lesen von PDF-Tabellen, um Aspose.PDF aus dem Maven-Repository hinzuzufügen
  2. Laden Sie die Beispiel-PDF-Datei, die eine Tabelle enthält, mithilfe des Document-Klassenobjekts
  3. Instanziieren und initialisieren Sie das Objekt TableAbsorber, um alle PDF-Tabellen von der ausgewählten PDF-Seite abzurufen
  4. Durchlaufen Sie alle Zeilen in der gewünschten Tabelle
  5. Durchlaufen Sie alle Zellen in der gewünschten Zeile und rufen Sie alle Textfragmente aus jeder Zelle ab
  6. Zeigt den aus der Zelle abgerufenen Text an

Diese Schritte erläutern die Verwendung von Java-Extraktionstabelle aus PDF zusammen mit den Informationen zu den erforderlichen Bibliotheken, die dem Projekt hinzugefügt werden sollen. Es gibt auch die Reihenfolge der Vorgänge an, um die Aufgabe abzuschließen, z. B. zuerst das PDF laden, dann auf eine bestimmte Seite zugreifen und die gewünschte Tabelle abrufen. Analysieren Sie schließlich alle Zeilen und Zellen, um die Informationen zu erhalten.

Code zum Lesen der PDF-Tabelle in Java

Zum Extrahieren einer Tabelle aus PDF Java-Code wird hier bereitgestellt, der die Klassen TableAbsorber und AbsorbedTable verwendet, um die Tabellen in PDF zu verarbeiten. Außerdem werden die Klassen AbsorbedRow und AbsorbedCell zum Verwalten von Zeilen und Spalten verwendet, bevor die Klasse TextFragment zum Abrufen der Zelldaten verwendet wird. Außerdem sind viele andere Absorberklassen für verschiedene Elemente im Dokument wie Schriftarten, Absätze, Text und Textfragmente verfügbar.

Dieser Artikel hat beschrieben, dass die Extraktion von PDF-Tabellen mit Java in wenigen Schritten durchgeführt werden kann. Wenn Sie erfahren möchten, wie Sie Text und Bilder aus einer PDF-Datei lesen, lesen Sie den Artikel zu Wie man PDF-Dateien in Java liest.

 Deutsch