Експорт даних з форми PDF до Excel за допомогою Java

Цей підручник описує, як експортувати дані з форми PDF до Excel за допомогою Java. У ньому міститься інформація про налаштування IDE, список кроків та зразок коду для вилучення даних з заповнюваного PDF до Excel за допомогою Java. Ви отримаєте деталі щодо експорту даних з форми PDF до XML-файлу, а потім завантаження цього XML-файлу в Workbook для збереження його як файл XLSX.

Кроки для експорту полів з PDF до Excel за допомогою Java

  1. Налаштуйте IDE для використання Aspose.PDF та Aspose.Cells для Java, щоб експортувати дані з форми PDF
  2. Використовуйте об’єкт Form з Aspose.PDF для завантаження PDF-файлу з полями форми
  3. Викличте метод Form.bindPdf(), щоб зв’язати PDF з об’єктом Form
  4. Створіть FileOutputStream для вихідного XML-файлу
  5. Викличте метод Form.exportXml(), щоб отримати дані форми та заповнити XML-файл
  6. Використовуйте об’єкт XmlLoadOptions з Aspose.Cells API для завантаження XML-файлу
  7. Завантажте об’єкт класу Workbook, щоб завантажити XML-файл та зберегти його як файл XLSX

Наведені вище кроки підсумовують, як вилучити поля з PDF до Excel за допомогою Java. Спочатку дані з форми PDF передаються до XML-файлу за допомогою Aspose.PDF API, який має метод Form.exportXml() для цієї мети. Нарешті, використовуйте Aspose.Cells API, щоб завантажити цей XML-файл в об’єкт Workbook та зберегти його у форматі файлу Excel XLSX.

Код для вилучення даних з форми PDF до Excel за допомогою Java

import com.aspose.pdf.Document;
import com.aspose.pdf.Field;
import com.aspose.pdf.License;
import com.aspose.pdf.WidgetAnnotation;
import com.aspose.pdf.facades.Form;
import com.aspose.cells.Workbook;
import com.aspose.cells.XmlLoadOptions;
import com.aspose.cells.SaveFormat;
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileInputStream;
import java.io.IOException;
public class Main {
public static void main(String[] args) throws Exception {
// Set license for Aspose.PDF
License pdfLic = new License();
try {
pdfLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
// Set license for Aspose.Cells
com.aspose.cells.License cellsLic = new com.aspose.cells.License();
try {
cellsLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
ExportDataToXml();
ConvertXmlToXlsx();
}
public static void ExportDataToXml() {
try {
Form pdfForm = new Form();
pdfForm.bindPdf("TextBox_out.pdf");
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml"));
pdfForm.exportXml(xmlOutputStream);
xmlOutputStream.close();
} catch (IOException e) {
e.printStackTrace();
}
}
public static void ConvertXmlToXlsx() {
try {
XmlLoadOptions options = new XmlLoadOptions();
options.setCheckDataValid(true);
Workbook wb = new Workbook("input.xml", options);
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX);
} catch (Exception e) {
e.printStackTrace();
}
}
}

Наведений вище код демонструє, як експортувати дані з заповнюваного PDF до Excel за допомогою Java. Він дозволяє розробнику налаштувати завантаження вихідного XML-файлу за допомогою різних методів та властивостей об’єкта XmlLoadOptions. Ви також можете використовувати метод setLoadFilter(LoadFilter value) для фільтрації даних під час завантаження з XML-файлу.

Ця стаття навчила нас процесу перетворення даних з форми PDF у файл Excel. Щоб вилучити вибране поле форми з певної сторінки, зверніться до статті про те, як Вилучити дані з форми PDF за допомогою Java.

 Українська