Αυτός ο γρήγορος οδηγός εξηγεί πώς να εξαγάγετε δεδομένα από μια φόρμα PDF σε Excel χρησιμοποιώντας C#. Περιλαμβάνει όλες τις λεπτομέρειες για τη ρύθμιση του περιβάλλοντος με το Aspose.PDF και το Aspose.Cells, ώστε να εξαγάγετε πεδία PDF σε Excel χρησιμοποιώντας C#. Παρατίθενται λεπτομερή βήματα για την εξαγωγή δεδομένων από PDF χρησιμοποιώντας ένα προϊόν και την αποθήκευσή τους ως αρχείο Excel χρησιμοποιώντας ένα άλλο προϊόν.
Βήματα για την Εξαγωγή Δεδομένων από Φόρμα Adobe σε Excel χρησιμοποιώντας C#
- Ρυθμίστε το περιβάλλον για τη χρήση των Aspose.PDF και Aspose.Cells για .NET.
- Δημιουργήστε ένα αντικείμενο της κλάσης Form στο Aspose.PDF και συνδέστε το με το αρχείο PDF που περιέχει τη φόρμα.
- Δημιουργήστε ένα αντικείμενο ροής για ένα αρχείο XML και καλέστε τη μέθοδο Form.ExportXml() για την εξαγωγή των δεδομένων της φόρμας στο αρχείο XML.
- Δημιουργήστε ένα αντικείμενο XmlLoadOptions από το Aspose.Cells.
- Φορτώστε το αρχείο XML στο αντικείμενο Workbook χρησιμοποιώντας Aspose.Cells.
- Αποθηκεύστε το Workbook ως αρχείο XLSX για τη μεταφορά των δεδομένων της φόρμας από XML σε αυτό.
Αυτά τα βήματα συνοψίζουν τη διαδικασία για την εξαγωγή δεδομένων φόρμας PDF σε Excel χρησιμοποιώντας C#. Αρχικά, φορτώστε το εισαγόμενο PDF με φόρμα χρησιμοποιώντας Form.BindPdf()
και εξαγάγετέ το σε αρχείο XML στο δίσκο με τη μέθοδο Form.ExportXml()
. Στη συνέχεια, φορτώστε το αρχείο XML με το αντικείμενο Aspose.Cells.Workbook
και αποθηκεύστε το Workbook ως αρχείο XLSX.
Κώδικας για την Εξαγωγή Συμπληρώσιμου PDF σε Excel χρησιμοποιώντας C#
using Aspose.Pdf; | |
using Aspose.Cells; | |
Aspose.Pdf.License pdfLic = new Aspose.Pdf.License(); | |
pdfLic.SetLicense("license.lic"); | |
Aspose.Cells.License cellsLic = new Aspose.Cells.License(); | |
cellsLic.SetLicense("license.lic"); | |
ExportDataToXml(); | |
ConvertXmlToXlsx(); | |
void ExportDataToXml() | |
{ | |
using (var pdfForm = new Aspose.Pdf.Facades.Form()) | |
{ | |
// Bind PDF document | |
pdfForm.BindPdf("TextBox_out.pdf"); | |
// Create XML file | |
using (var xmlOutputStream = new FileStream("input.xml", FileMode.Create)) | |
{ | |
// Export data | |
pdfForm.ExportXml(xmlOutputStream); | |
} | |
} | |
} | |
void ConvertXmlToXlsx() | |
{ | |
Aspose.Cells.LoadOptions options = new Aspose.Cells.XmlLoadOptions(); | |
options.CheckDataValid = true; | |
Workbook wb = new Workbook("input.xml", options); | |
wb.Save("XmlToXlsx.xlsx", Aspose.Cells.SaveFormat.Xlsx); | |
} |
Το παραπάνω δείγμα κώδικα περιγράφει πώς να εξάγετε δεδομένα από συμπληρώσιμο PDF σε Excel χρησιμοποιώντας C#. Έχουμε χρησιμοποιήσει ένα αντικείμενο της κλάσης Aspose.Pdf.Facades.Form
, το οποίο περιέχει τη μέθοδο BindPdf()
για τη σύνδεση του PDF με αυτό. Μπορείτε να χρησιμοποιήσετε το αντικείμενο XmlLoadOptions
για να προσαρμόσετε τη φόρτωση του νέου αρχείου XML, όπως έλεγχο περιορισμών του Excel κατά τη φόρτωση, επιλογές μετατροπής αριθμητικών τιμών σε αριθμούς ή ημερομηνίες στο αρχείο Excel, και άλλες παραμέτρους.
Αυτό το σεμινάριο μας δίδαξε πώς να διαβάζουμε δεδομένα φόρμας PDF σε ένα αρχείο Excel. Για να αποκτήσετε πρόσβαση σε μεμονωμένα πεδία μιας φόρμας, ανατρέξτε στο άρθρο Εξαγωγή δεδομένων από φόρμα PDF χρησιμοποιώντας C#.