Ovaj vodič opisuje kako izvesti podatke iz PDF obrasca u Excel pomoću Jave. Sadrži informacije o postavljanju IDE-a, popis koraka i primjer koda za izdvajanje podataka iz ispunjivog PDF obrasca u Excel pomoću Jave. Naučit ćete kako izvesti podatke iz PDF obrasca u XML datoteku, a zatim tu XML datoteku učitati u Workbook kako biste je spremili kao XLSX datoteku.
Koraci za izvoz PDF polja u Excel pomoću Jave
- Postavite IDE za korištenje Aspose.PDF i Aspose.Cells za Javu kako biste izvezli podatke iz PDF obrasca.
- Koristite objekt Form iz Aspose.PDF za učitavanje PDF datoteke s poljima obrasca.
- Pozovite metodu Form.bindPdf() za povezivanje PDF-a s objektom Form.
- Kreirajte FileOutputStream za izlaznu XML datoteku.
- Pozovite metodu Form.exportXml() za dohvat podataka obrasca i spremanje u XML datoteku.
- Koristite objekt XmlLoadOptions iz Aspose.Cells API-ja za učitavanje XML datoteke.
- Učitajte objekt Workbook kako biste učitali XML datoteku i spremili je kao XLSX datoteku.
Gornji koraci sažimaju kako izdvojiti PDF polja u Excel pomoću Jave. Prvo, pomoću API-ja Aspose.PDF i metode Form.exportXml() prenesite podatke PDF obrasca u XML datoteku. Na kraju, koristite Aspose.Cells API za učitavanje te XML datoteke u objekt Workbook i spremanje u Excel formatu XLSX.
Kod za izdvajanje podataka iz PDF obrasca u Excel pomoću Jave
import com.aspose.pdf.Document; | |
import com.aspose.pdf.Field; | |
import com.aspose.pdf.License; | |
import com.aspose.pdf.WidgetAnnotation; | |
import com.aspose.pdf.facades.Form; | |
import com.aspose.cells.Workbook; | |
import com.aspose.cells.XmlLoadOptions; | |
import com.aspose.cells.SaveFormat; | |
import java.io.File; | |
import java.io.FileOutputStream; | |
import java.io.FileInputStream; | |
import java.io.IOException; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Set license for Aspose.PDF | |
License pdfLic = new License(); | |
try { | |
pdfLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
// Set license for Aspose.Cells | |
com.aspose.cells.License cellsLic = new com.aspose.cells.License(); | |
try { | |
cellsLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
ExportDataToXml(); | |
ConvertXmlToXlsx(); | |
} | |
public static void ExportDataToXml() { | |
try { | |
Form pdfForm = new Form(); | |
pdfForm.bindPdf("TextBox_out.pdf"); | |
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml")); | |
pdfForm.exportXml(xmlOutputStream); | |
xmlOutputStream.close(); | |
} catch (IOException e) { | |
e.printStackTrace(); | |
} | |
} | |
public static void ConvertXmlToXlsx() { | |
try { | |
XmlLoadOptions options = new XmlLoadOptions(); | |
options.setCheckDataValid(true); | |
Workbook wb = new Workbook("input.xml", options); | |
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
} | |
} |
Gornji kod pokazuje kako izvesti podatke iz ispunjivog PDF obrasca u Excel pomoću Jave. Programerima omogućuje prilagodbu učitavanja izlazne XML datoteke pomoću različitih metoda i svojstava u objektu XmlLoadOptions. Također možete koristiti metodu setLoadFilter(LoadFilter value) za filtriranje podataka tijekom učitavanja iz XML datoteke.
Ovaj članak nam je pokazao kako pretvoriti podatke iz PDF obrasca u Excel datoteku. Za izdvajanje određenog polja obrasca s određene stranice, pogledajte članak o Izdvajanju podataka iz PDF obrasca pomoću Jave.