Αυτό το άρθρο περιγράφει πώς να εξάγετε έναν πίνακα από PDF σε Excel χρησιμοποιώντας Python. Περιέχει όλες τις λεπτομέρειες για τη χρήση και των δύο προϊόντων, δηλαδή Aspose.PDF και Aspose.Cells, μια λίστα βημάτων και ένα δείγμα κώδικα για εξαγωγή πίνακα Excel από PDF χρησιμοποιώντας Python. Ο κώδικας δείγματος θα δείξει τη πλήρη διαδικασία μεταφοράς του πίνακα από μια σελίδα PDF σε φύλλο Excel.
Βήματα για την εξαγωγή πίνακα από PDF σε Excel χρησιμοποιώντας Python
- Ρυθμίστε το περιβάλλον για την εγκατάσταση Aspose.Total For Python via .NET
- Εφαρμόστε την άδεια για τις σχετικές εισαγόμενες βιβλιοθήκες, δηλαδή Aspose.Cells και Aspose.PDF
- Φορτώστε το αρχείο PDF προέλευσης με πίνακες χρησιμοποιώντας το αντικείμενο κλάσης Document
- Δημιουργήστε ένα κενό αρχείο Excel χρησιμοποιώντας την κλάση Workbook και ορίστε ένα όνομα για το πρώτο φύλλο
- Επανάληψη σε κάθε σελίδα στη συλλογή των σελίδων του αρχείου PDF
- Πρόσβαση στη συλλογή των πινάκων και ανάλυση κάθε κελιού στον πίνακα
- Ανάκτηση κειμένου από το κελί PDF και αντιγραφή του στο αντίστοιχο κελί στο φύλλο Excel
- Αποθηκεύστε το αρχείο Excel στο δίσκο με τα δεδομένα του πίνακα από το PDF
Αυτά τα βήματα περιλαμβάνουν τη διαδικασία για εξαγωγή δεδομένων από πίνακα PDF σε Excel χρησιμοποιώντας Python. Εισάγετε τις απαραίτητες βιβλιοθήκες, φορτώστε το αρχείο PDF προέλευσης, αποκτήστε πρόσβαση σε κάθε σελίδα και στη συλλογή πινάκων σε αυτήν, και επεξεργαστείτε όλους τους πίνακες. Τέλος, αποκτήστε πρόσβαση σε κάθε κελί σε έναν πίνακα PDF και αποθηκεύστε το περιεχόμενό του στο αντίστοιχο κελί στο εξαγόμενο φύλλο εργασίας Excel.
Κώδικας για εξαγωγή πίνακα από PDF σε Excel, χρησιμοποιώντας Python.
Αυτός ο κώδικας δείχνει πώς να λάβετε πίνακα από PDF σε Excel χρησιμοποιώντας Python. Μπορείτε να δοκιμάσετε μια διαφορετική μηχανή αναγνώρισης πινάκων χρησιμοποιώντας την επιλογή use_flow_engine στην κλάση TableAbsorber για να εντοπίσετε πίνακες χωρίς περιθώρια στο PDF. Χρησιμοποιήστε το text_state στο απορροφημένο κελί για να ανακτήσετε το όνομα γραμματοσειράς, το μέγεθος, το χρώμα φόντου, το χρώμα προσκηνίου και το έντονο πλάγιο στυλ για την προσαρμογή της μορφής του προορισμού κελιού Excel ώστε να διατηρήσετε τη μορφή των πινάκων παρόμοια και στα δύο αρχεία.
Αυτό το άρθρο βοήθησε στην κατανόηση της διαδικασίας μεταφοράς ενός πίνακα PDF στο Excel. Για να εγκαταστήσετε την Python ώστε να εκτελεί το Aspose.PDF για Python μέσω .NET, ανατρέξτε στο άρθρο Πώς να εγκαταστήσετε την Python για να εκτελέσετε το Aspose.PDF για Python μέσω .ΔΙΚΤΥΟ.