Eksportuoti duomenis iš PDF formos į Excel naudojant Java

Ši mokomoji medžiaga paaiškina, kaip eksportuoti duomenis iš PDF formos į Excel naudojant Java. Joje rasite informaciją apie IDE nustatymus, veiksmų sąrašą ir pavyzdinį kodą, kaip išgauti duomenis iš pildomo PDF į Excel naudojant Java. Pirmiausia PDF formos duomenys eksportuojami į XML failą, tada XML įkeliamas į Workbook objektą, kuris išsaugomas kaip XLSX failas.

Veiksmai, kaip eksportuoti PDF laukus į Excel naudojant Java

  1. Nustatykite IDE darbui su Aspose.PDF ir Aspose.Cells for Java, kad galėtumėte eksportuoti PDF formos duomenis.
  2. Naudokite Form objektą iš Aspose.PDF, kad įkeltumėte PDF failą su formos laukais.
  3. Iškvieskite Form.bindPdf() metodą, kad susietumėte PDF su Form objektu.
  4. Sukurkite FileOutputStream išvesties XML failui.
  5. Iškvieskite Form.exportXml() metodą, kad gautumėte formos duomenis ir įrašytumėte juos į XML failą.
  6. Naudokite XmlLoadOptions objektą iš Aspose.Cells API XML failui įkelti.
  7. Įkelkite Workbook objektą, kad atidarytumėte XML failą ir išsaugotumėte jį kaip XLSX failą.

Šie veiksmai parodo, kaip išgauti PDF laukus ir konvertuoti juos į Excel naudojant Java. Pirmiausia PDF formos duomenys eksportuojami į XML failą naudojant Aspose.PDF API Form.exportXml() metodą. Tuomet Aspose.Cells API naudojamas šiam XML failui įkelti į Workbook objektą ir išsaugoti Excel formatu (XLSX).

Kodas, kaip išgauti duomenis iš PDF formos į Excel naudojant Java

import com.aspose.pdf.Document;
import com.aspose.pdf.Field;
import com.aspose.pdf.License;
import com.aspose.pdf.WidgetAnnotation;
import com.aspose.pdf.facades.Form;
import com.aspose.cells.Workbook;
import com.aspose.cells.XmlLoadOptions;
import com.aspose.cells.SaveFormat;
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileInputStream;
import java.io.IOException;
public class Main {
public static void main(String[] args) throws Exception {
// Set license for Aspose.PDF
License pdfLic = new License();
try {
pdfLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
// Set license for Aspose.Cells
com.aspose.cells.License cellsLic = new com.aspose.cells.License();
try {
cellsLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
ExportDataToXml();
ConvertXmlToXlsx();
}
public static void ExportDataToXml() {
try {
Form pdfForm = new Form();
pdfForm.bindPdf("TextBox_out.pdf");
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml"));
pdfForm.exportXml(xmlOutputStream);
xmlOutputStream.close();
} catch (IOException e) {
e.printStackTrace();
}
}
public static void ConvertXmlToXlsx() {
try {
XmlLoadOptions options = new XmlLoadOptions();
options.setCheckDataValid(true);
Workbook wb = new Workbook("input.xml", options);
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX);
} catch (Exception e) {
e.printStackTrace();
}
}
}

Aukščiau pateiktas kodas demonstruoja, kaip eksportuoti duomenis iš pildomo PDF į Excel naudojant Java. Naudojant XmlLoadOptions objektą, galima tinkinti išvesties XML failo įkėlimą naudojant įvairius metodus ir savybes. Taip pat galima naudoti setLoadFilter(LoadFilter value) metodą duomenų filtravimui iš XML failo.

Šiame straipsnyje išmokote, kaip konvertuoti PDF formos duomenis į Excel failą. Jei norite išgauti konkretų formos lauką iš tam tikro puslapio, peržiūrėkite straipsnį apie duomenų išgavimą iš PDF formos naudojant Java.

 Latviski