Dit artikel beschrijft hoe je een tabel kunt extraheren van PDF naar Excel met Python. Het bevat alle details om beide producten te gebruiken, d.w.z. Aspose.PDF en Aspose.Cellen, een lijst met stappen, en een voorbeeldcode om een Excel‑tabel uit een PDF te extraheren met Python. De voorbeeldcode demonstreert het volledige proces door de tabel van een PDF‑pagina naar een Excel‑werkblad over te dragen.
Stappen om tabel uit PDF naar Excel te extraheren met Python
- Stel de omgeving in om Aspose.Total For Python via .NET te installeren
- Pas de licentie toe op de relevante geïmporteerde bibliotheken, d.w.z. Aspose.Cellen en Aspose.PDF
- Laad het bron‑PDF‑bestand met tabellen met behulp van het Document klasse‑object
- Maak een leeg Excel‑bestand met behulp van de Workbook klasse en stel een naam in voor het eerste blad
- Doorloop elke pagina in de verzameling pagina’s in het PDF‑bestand
- Toegang tot de verzameling tabellen en doorloop elke cel in de tabel
- Haal tekst op uit de PDF‑cel en kopieer deze naar de respectieve cel in het Excel‑werkblad
- Sla het Excel‑bestand op de schijf op met de tabelgegevens uit de PDF.
Deze stappen omvatten het proces om gegevens uit een PDF‑tabel naar Excel te extraheren met Python. Importeer de benodigde bibliotheken, laad het bron‑PDF‑bestand, krijg toegang tot elke pagina en de verzameling tabellen daarop, en doorloop alle tabellen. Ten slotte, krijg toegang tot elke cel in een PDF‑tabel en sla de inhoud op in de respectieve cel in het uitvoer‑Excel‑werkblad.
Code om een tabel uit een PDF naar Excel te halen met Python
Deze code toont hoe je tabel uit PDF naar Excel kunt halen met Python. Je kunt een andere tabelherkenningsengine proberen met de use_flow_engine‑optie in de TableAbsorber‑klasse om randloze tabellen in de PDF te detecteren. Gebruik de text_state in de geabsorbeerde cel om de lettertype‑naam, grootte, achtergrondkleur, voorgrondkleur en vet‑cursieve stijl op te halen voor het aanpassen van het bestemmings‑Excel‑celformaat om het tabelformaat in beide bestanden vergelijkbaar te houden.
Dit artikel heeft geholpen bij het begrijpen van het proces van het overzetten van een PDF‑tabel naar Excel. Om Python te installeren voor Aspose.PDF voor Python via .NET uit te voeren, raadpleeg het artikel [Hoe Python te installeren om Aspose uit te voeren].PDF voor Python via .NET]( https://kb.aspose.com/ nl/total/python/how-to-install-python-to-run-aspose-pdf-for-python-via-net/).