Εξαγωγή δεδομένων από μια φόρμα PDF σε Excel με Java

Αυτός ο οδηγός περιγράφει πώς να εξάγετε δεδομένα από μια PDF φόρμα σε Excel χρησιμοποιώντας Java. Περιλαμβάνει πληροφορίες για τη ρύθμιση του IDE, μια λίστα βημάτων και ένα δείγμα κώδικα για την εξαγωγή δεδομένων από μια συμπληρώσιμη φόρμα PDF σε Excel με Java. Θα βρείτε λεπτομέρειες για την εξαγωγή των δεδομένων της φόρμας PDF σε ένα αρχείο XML και στη συνέχεια τη φόρτωση του XML σε ένα Workbook για αποθήκευση ως αρχείο XLSX.

Βήματα για την εξαγωγή πεδίων PDF σε Excel με Java

  1. Ρυθμίστε το IDE για τη χρήση του Aspose.PDF και του Aspose.Cells για Java για την εξαγωγή δεδομένων από φόρμα PDF
  2. Χρησιμοποιήστε το αντικείμενο Form από το Aspose.PDF για να φορτώσετε το αρχείο PDF με τα πεδία της φόρμας
  3. Καλέστε τη μέθοδο Form.bindPdf() για να συνδέσετε το PDF με το αντικείμενο Form
  4. Δημιουργήστε το FileOutputStream για το αρχείο XML εξόδου
  5. Καλέστε τη μέθοδο Form.exportXml() για να εξαγάγετε τα δεδομένα της φόρμας και να τα αποθηκεύσετε στο αρχείο XML
  6. Χρησιμοποιήστε το αντικείμενο XmlLoadOptions από το Aspose.Cells API για τη φόρτωση του αρχείου XML
  7. Φορτώστε το αντικείμενο Workbook για να διαβάσετε το αρχείο XML και να το αποθηκεύσετε ως αρχείο XLSX

Τα παραπάνω βήματα συνοψίζουν τη διαδικασία για την εξαγωγή πεδίων PDF σε Excel με Java. Αρχικά, μεταφέρετε τα δεδομένα της φόρμας PDF σε ένα αρχείο XML χρησιμοποιώντας το API Aspose.PDF και τη μέθοδο Form.exportXml(). Στη συνέχεια, χρησιμοποιήστε το API Aspose.Cells για να φορτώσετε το XML σε ένα αντικείμενο Workbook και να το αποθηκεύσετε ως αρχείο Excel XLSX.

Κώδικας για την εξαγωγή δεδομένων από φόρμα PDF σε Excel με Java

import com.aspose.pdf.Document;
import com.aspose.pdf.Field;
import com.aspose.pdf.License;
import com.aspose.pdf.WidgetAnnotation;
import com.aspose.pdf.facades.Form;
import com.aspose.cells.Workbook;
import com.aspose.cells.XmlLoadOptions;
import com.aspose.cells.SaveFormat;
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileInputStream;
import java.io.IOException;
public class Main {
public static void main(String[] args) throws Exception {
// Set license for Aspose.PDF
License pdfLic = new License();
try {
pdfLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
// Set license for Aspose.Cells
com.aspose.cells.License cellsLic = new com.aspose.cells.License();
try {
cellsLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
ExportDataToXml();
ConvertXmlToXlsx();
}
public static void ExportDataToXml() {
try {
Form pdfForm = new Form();
pdfForm.bindPdf("TextBox_out.pdf");
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml"));
pdfForm.exportXml(xmlOutputStream);
xmlOutputStream.close();
} catch (IOException e) {
e.printStackTrace();
}
}
public static void ConvertXmlToXlsx() {
try {
XmlLoadOptions options = new XmlLoadOptions();
options.setCheckDataValid(true);
Workbook wb = new Workbook("input.xml", options);
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX);
} catch (Exception e) {
e.printStackTrace();
}
}
}

Ο παραπάνω κώδικας δείχνει πώς να εξαγάγετε δεδομένα από μια συμπληρώσιμη φόρμα PDF σε Excel με Java. Παρέχει στους προγραμματιστές τη δυνατότητα να προσαρμόζουν τη φόρτωση του αρχείου XML εξόδου χρησιμοποιώντας διάφορες μεθόδους και ιδιότητες στο αντικείμενο XmlLoadOptions. Μπορείτε επίσης να χρησιμοποιήσετε τη μέθοδο setLoadFilter(LoadFilter value) για να φιλτράρετε τα δεδομένα κατά τη φόρτωση από το XML αρχείο.

Αυτό το άρθρο μας έδειξε τη διαδικασία μετατροπής των δεδομένων μιας φόρμας PDF σε αρχείο Excel. Για να εξαγάγετε ένα συγκεκριμένο πεδίο φόρμας από μια συγκεκριμένη σελίδα, ανατρέξτε στο άρθρο σχετικά με την Εξαγωγή δεδομένων από φόρμα PDF με Java.

 Ελληνικά