Tento tutoriál popisuje, jak exportovat data z PDF formuláře do Excelu pomocí Javy. Obsahuje informace o nastavení IDE, seznam kroků a ukázkový kód pro extrahování dat z vyplnitelného PDF do Excelu pomocí Javy. Získáte podrobnosti o exportu dat z PDF formuláře do XML souboru a následném načtení XML souboru do Workbooku pro uložení jako soubor XLSX.
Kroky k exportu polí z PDF do Excelu pomocí Javy
- Nastavte IDE pro použití Aspose.PDF a Aspose.Cells pro Javu k exportu dat z PDF formuláře
- Použijte objekt Form z Aspose.PDF k načtení PDF souboru s formulářovými poli
- Použijte metodu Form.bindPdf() k propojení PDF s objektem Form
- Vytvořte FileOutputStream pro výstupní XML soubor
- Zavolejte metodu Form.exportXml() pro získání dat z formuláře a jejich uložení do XML souboru
- Použijte objekt XmlLoadOptions z Aspose.Cells API pro načtení XML souboru
- Načtěte objekt třídy Workbook pro načtení XML souboru a uložte jej jako soubor XLSX
Výše uvedené kroky shrnují, jak extrahovat pole z PDF do Excelu pomocí Javy. Nejprve přeneste data z PDF formuláře do XML souboru pomocí Aspose.PDF API, které má pro tento účel metodu Form.exportXml(). Nakonec použijte Aspose.Cells API k načtení tohoto XML souboru do objektu Workbook a uložte jej jako soubor ve formátu Excelu XLSX.
Kód pro extrahování dat z PDF formuláře do Excelu pomocí Javy
import com.aspose.pdf.Document; | |
import com.aspose.pdf.Field; | |
import com.aspose.pdf.License; | |
import com.aspose.pdf.WidgetAnnotation; | |
import com.aspose.pdf.facades.Form; | |
import com.aspose.cells.Workbook; | |
import com.aspose.cells.XmlLoadOptions; | |
import com.aspose.cells.SaveFormat; | |
import java.io.File; | |
import java.io.FileOutputStream; | |
import java.io.FileInputStream; | |
import java.io.IOException; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Set license for Aspose.PDF | |
License pdfLic = new License(); | |
try { | |
pdfLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
// Set license for Aspose.Cells | |
com.aspose.cells.License cellsLic = new com.aspose.cells.License(); | |
try { | |
cellsLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
ExportDataToXml(); | |
ConvertXmlToXlsx(); | |
} | |
public static void ExportDataToXml() { | |
try { | |
Form pdfForm = new Form(); | |
pdfForm.bindPdf("TextBox_out.pdf"); | |
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml")); | |
pdfForm.exportXml(xmlOutputStream); | |
xmlOutputStream.close(); | |
} catch (IOException e) { | |
e.printStackTrace(); | |
} | |
} | |
public static void ConvertXmlToXlsx() { | |
try { | |
XmlLoadOptions options = new XmlLoadOptions(); | |
options.setCheckDataValid(true); | |
Workbook wb = new Workbook("input.xml", options); | |
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
} | |
} |
Výše uvedený kód ukazuje, jak exportovat data z vyplnitelného PDF do Excelu pomocí Javy. Umožňuje vývojáři přizpůsobit načítání výstupního XML souboru pomocí různých metod a vlastností v objektu XmlLoadOptions. Můžete také použít metodu setLoadFilter(LoadFilter value) k filtrování dat při načítání z XML souboru.
Tento článek nás naučil proces převodu dat z PDF formuláře do souboru Excel. Chcete-li extrahovat vybrané pole formuláře z konkrétní stránky, podívejte se na článek o tom, jak Extrahovat data z PDF formuláře pomocí Javy.