Tabelle aus PDF nach Excel mit Python extrahieren

Dieser Artikel beschreibt, wie man eine Tabelle von PDF nach Excel mit Python extrahiert. Er enthält alle Details zur Nutzung beider Produkte, d. h. Aspose.PDF und Aspose.Zellen, eine Schritt‑für‑Schritt‑Liste und Beispielcode zum Extrahieren einer Excel‑Tabelle aus PDF mit Python. Der Beispielcode demonstriert den kompletten Prozess, indem er die Tabelle von einer PDF‑Seite in ein Excel‑Blatt überträgt.

Schritte zum Extrahieren einer Tabelle aus PDF nach Excel mit Python

  1. Richten Sie die Umgebung ein, um Aspose.Total For Python via .NET zu installieren
  2. Wenden Sie die Lizenz für die relevanten importierten Bibliotheken an, d.h. h. Aspose.Zellen und Aspose.PDF
  3. Laden Sie die Quell‑PDF‑Datei mit Tabellen mithilfe des Document Klassenobjekts
  4. Erstelle eine leere Excel‑Datei mit der Workbook‑Klasse und lege einen Namen für das erste Blatt fest.
  5. Durchlaufen Sie jede Seite in der Sammlung von Seiten der PDF‑Datei.
  6. Greifen Sie auf die Sammlung von Tabellen zu und durchlaufen Sie jede Zelle in der Tabelle.
  7. Text aus der PDF‑Zelle abrufen und in die entsprechende Zelle im Excel‑Blatt kopieren.
  8. Speichern Sie die Excel‑Datei auf der Festplatte mit den Tabellendaten aus dem PDF.

Diese Schritte umfassen den Prozess, um Daten aus einer PDF‑Tabelle mit Python nach Excel zu extrahieren. Importieren Sie die notwendigen Bibliotheken, laden Sie die Quell‑PDF‑Datei, greifen Sie auf jede Seite und die darauf befindlichen Tabellensammlungen zu und durchlaufen Sie alle Tabellen. Schließlich greifen Sie auf jede Zelle in einer PDF‑Tabelle zu und speichern deren Inhalt in der jeweiligen Zelle im Ausgabearbeitsblatt von Excel.

Code zum Extrahieren einer Tabelle aus PDF in Excel mit Python

Dieser Code demonstriert, wie man Tabellen von PDF nach Excel mit Python erhält. Sie können eine andere Tabellenerkennungs‑Engine ausprobieren, indem Sie die Option use_flow_engine in der Klasse TableAbsorber verwenden, um randlose Tabellen im PDF zu erkennen. Verwenden Sie den text_state in der absorbierten Zelle, um den Schriftartnamen, die Größe, die Hintergrundfarbe, die Vordergrundfarbe und den fett‑kursiven Stil abzurufen, um das Zielformat der Excel‑Zelle anzupassen, damit das Tabellenformat in beiden Dateien ähnlich bleibt.

Dieser Artikel hat beim Verständnis des Prozesses, eine PDF‑Tabelle nach Excel zu übertragen, geholfen. Um Python zu installieren, um Aspose.PDF für Python über.Um .NET auszuführen, siehe den Artikel „Wie man Python installiert, um Aspose zu verwenden“.PDF für Python über.NET auszuführen]( https://kb.aspose.com/ de/total/python/how-to-install-python-to-run-aspose-pdf-for-python-via-net/).

 Deutsch