Tutorial ini menjelaskan cara mengekspor data dari PDF ke Excel menggunakan Java. Artikel ini mencakup informasi tentang pengaturan IDE, daftar langkah-langkah, serta contoh kode untuk mengekstrak data dari formulir PDF yang dapat diisi ke Excel menggunakan Java. Anda akan belajar bagaimana mengekspor data dari formulir PDF ke dalam file XML, lalu memuat file XML tersebut ke dalam objek Workbook dan menyimpannya sebagai file XLSX.
Langkah-langkah untuk Mengekspor Bidang PDF ke Excel menggunakan Java
- Atur IDE untuk menggunakan Aspose.PDF dan Aspose.Cells guna mengekspor data formulir PDF.
- Gunakan objek Form dari Aspose.PDF untuk memuat file PDF yang memiliki bidang formulir.
- Panggil metode Form.bindPdf() untuk menghubungkan PDF dengan objek Form.
- Buat FileOutputStream untuk file XML keluaran.
- Panggil metode Form.exportXml() untuk mengambil data formulir dan menyimpannya ke dalam file XML.
- Gunakan objek XmlLoadOptions dari API Aspose.Cells untuk memuat file XML.
- Muat objek Workbook untuk membaca file XML dan menyimpannya sebagai file XLSX.
Langkah-langkah di atas merangkum cara mengekstrak bidang PDF ke Excel menggunakan Java. Pertama, gunakan API Aspose.PDF untuk mengekspor data formulir PDF ke dalam file XML menggunakan metode Form.exportXml(). Selanjutnya, gunakan API Aspose.Cells untuk memuat file XML tersebut ke dalam objek Workbook dan menyimpannya dalam format Excel (XLSX).
Kode untuk Mengekstrak Data dari Formulir PDF ke Excel menggunakan Java
import com.aspose.pdf.Document; | |
import com.aspose.pdf.Field; | |
import com.aspose.pdf.License; | |
import com.aspose.pdf.WidgetAnnotation; | |
import com.aspose.pdf.facades.Form; | |
import com.aspose.cells.Workbook; | |
import com.aspose.cells.XmlLoadOptions; | |
import com.aspose.cells.SaveFormat; | |
import java.io.File; | |
import java.io.FileOutputStream; | |
import java.io.FileInputStream; | |
import java.io.IOException; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Set license for Aspose.PDF | |
License pdfLic = new License(); | |
try { | |
pdfLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
// Set license for Aspose.Cells | |
com.aspose.cells.License cellsLic = new com.aspose.cells.License(); | |
try { | |
cellsLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
ExportDataToXml(); | |
ConvertXmlToXlsx(); | |
} | |
public static void ExportDataToXml() { | |
try { | |
Form pdfForm = new Form(); | |
pdfForm.bindPdf("TextBox_out.pdf"); | |
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml")); | |
pdfForm.exportXml(xmlOutputStream); | |
xmlOutputStream.close(); | |
} catch (IOException e) { | |
e.printStackTrace(); | |
} | |
} | |
public static void ConvertXmlToXlsx() { | |
try { | |
XmlLoadOptions options = new XmlLoadOptions(); | |
options.setCheckDataValid(true); | |
Workbook wb = new Workbook("input.xml", options); | |
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
} | |
} |
Kode di atas menunjukkan cara mengekspor data dari formulir PDF yang dapat diisi ke Excel menggunakan Java. Pengembang dapat menyesuaikan pemuatan file XML keluaran menggunakan berbagai metode dan properti dalam objek XmlLoadOptions. Anda juga dapat menggunakan metode setLoadFilter(LoadFilter value) untuk memfilter data saat memuat dari file XML.
Artikel ini telah mengajarkan proses mengonversi data formulir PDF ke dalam file Excel. Untuk mengekstrak bidang formulir tertentu dari halaman tertentu, lihat artikel tentang Ekstraksi Data dari Formulir PDF menggunakan Java.