Izvoz podataka iz PDF obrasca u Excel pomoću Jave

Ovaj vodič opisuje kako izvesti podatke iz PDF obrasca u Excel pomoću Jave. Sadrži informacije o postavljanju IDE-a, popis koraka i primjer koda za izdvajanje podataka iz ispunjivog PDF obrasca u Excel pomoću Jave. Naučit ćete kako izvesti podatke iz PDF obrasca u XML datoteku, a zatim tu XML datoteku učitati u Workbook kako biste je spremili kao XLSX datoteku.

Koraci za izvoz PDF polja u Excel pomoću Jave

  1. Postavite IDE za korištenje Aspose.PDF i Aspose.Cells za Javu kako biste izvezli podatke iz PDF obrasca.
  2. Koristite objekt Form iz Aspose.PDF za učitavanje PDF datoteke s poljima obrasca.
  3. Pozovite metodu Form.bindPdf() za povezivanje PDF-a s objektom Form.
  4. Kreirajte FileOutputStream za izlaznu XML datoteku.
  5. Pozovite metodu Form.exportXml() za dohvat podataka obrasca i spremanje u XML datoteku.
  6. Koristite objekt XmlLoadOptions iz Aspose.Cells API-ja za učitavanje XML datoteke.
  7. Učitajte objekt Workbook kako biste učitali XML datoteku i spremili je kao XLSX datoteku.

Gornji koraci sažimaju kako izdvojiti PDF polja u Excel pomoću Jave. Prvo, pomoću API-ja Aspose.PDF i metode Form.exportXml() prenesite podatke PDF obrasca u XML datoteku. Na kraju, koristite Aspose.Cells API za učitavanje te XML datoteke u objekt Workbook i spremanje u Excel formatu XLSX.

Kod za izdvajanje podataka iz PDF obrasca u Excel pomoću Jave

import com.aspose.pdf.Document;
import com.aspose.pdf.Field;
import com.aspose.pdf.License;
import com.aspose.pdf.WidgetAnnotation;
import com.aspose.pdf.facades.Form;
import com.aspose.cells.Workbook;
import com.aspose.cells.XmlLoadOptions;
import com.aspose.cells.SaveFormat;
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileInputStream;
import java.io.IOException;
public class Main {
public static void main(String[] args) throws Exception {
// Set license for Aspose.PDF
License pdfLic = new License();
try {
pdfLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
// Set license for Aspose.Cells
com.aspose.cells.License cellsLic = new com.aspose.cells.License();
try {
cellsLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
ExportDataToXml();
ConvertXmlToXlsx();
}
public static void ExportDataToXml() {
try {
Form pdfForm = new Form();
pdfForm.bindPdf("TextBox_out.pdf");
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml"));
pdfForm.exportXml(xmlOutputStream);
xmlOutputStream.close();
} catch (IOException e) {
e.printStackTrace();
}
}
public static void ConvertXmlToXlsx() {
try {
XmlLoadOptions options = new XmlLoadOptions();
options.setCheckDataValid(true);
Workbook wb = new Workbook("input.xml", options);
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX);
} catch (Exception e) {
e.printStackTrace();
}
}
}

Gornji kod pokazuje kako izvesti podatke iz ispunjivog PDF obrasca u Excel pomoću Jave. Programerima omogućuje prilagodbu učitavanja izlazne XML datoteke pomoću različitih metoda i svojstava u objektu XmlLoadOptions. Također možete koristiti metodu setLoadFilter(LoadFilter value) za filtriranje podataka tijekom učitavanja iz XML datoteke.

Ovaj članak nam je pokazao kako pretvoriti podatke iz PDF obrasca u Excel datoteku. Za izdvajanje određenog polja obrasca s određene stranice, pogledajte članak o Izdvajanju podataka iz PDF obrasca pomoću Jave.

 Hrvatski