Цей підручник описує, як експортувати дані з форми PDF до Excel за допомогою Java. У ньому міститься інформація про налаштування IDE, список кроків та зразок коду для вилучення даних з заповнюваного PDF до Excel за допомогою Java. Ви отримаєте деталі щодо експорту даних з форми PDF до XML-файлу, а потім завантаження цього XML-файлу в Workbook для збереження його як файл XLSX.
Кроки для експорту полів з PDF до Excel за допомогою Java
- Налаштуйте IDE для використання Aspose.PDF та Aspose.Cells для Java, щоб експортувати дані з форми PDF
- Використовуйте об’єкт Form з Aspose.PDF для завантаження PDF-файлу з полями форми
- Викличте метод Form.bindPdf(), щоб зв’язати PDF з об’єктом Form
- Створіть FileOutputStream для вихідного XML-файлу
- Викличте метод Form.exportXml(), щоб отримати дані форми та заповнити XML-файл
- Використовуйте об’єкт XmlLoadOptions з Aspose.Cells API для завантаження XML-файлу
- Завантажте об’єкт класу Workbook, щоб завантажити XML-файл та зберегти його як файл XLSX
Наведені вище кроки підсумовують, як вилучити поля з PDF до Excel за допомогою Java. Спочатку дані з форми PDF передаються до XML-файлу за допомогою Aspose.PDF API, який має метод Form.exportXml() для цієї мети. Нарешті, використовуйте Aspose.Cells API, щоб завантажити цей XML-файл в об’єкт Workbook та зберегти його у форматі файлу Excel XLSX.
Код для вилучення даних з форми PDF до Excel за допомогою Java
import com.aspose.pdf.Document; | |
import com.aspose.pdf.Field; | |
import com.aspose.pdf.License; | |
import com.aspose.pdf.WidgetAnnotation; | |
import com.aspose.pdf.facades.Form; | |
import com.aspose.cells.Workbook; | |
import com.aspose.cells.XmlLoadOptions; | |
import com.aspose.cells.SaveFormat; | |
import java.io.File; | |
import java.io.FileOutputStream; | |
import java.io.FileInputStream; | |
import java.io.IOException; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Set license for Aspose.PDF | |
License pdfLic = new License(); | |
try { | |
pdfLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
// Set license for Aspose.Cells | |
com.aspose.cells.License cellsLic = new com.aspose.cells.License(); | |
try { | |
cellsLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
ExportDataToXml(); | |
ConvertXmlToXlsx(); | |
} | |
public static void ExportDataToXml() { | |
try { | |
Form pdfForm = new Form(); | |
pdfForm.bindPdf("TextBox_out.pdf"); | |
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml")); | |
pdfForm.exportXml(xmlOutputStream); | |
xmlOutputStream.close(); | |
} catch (IOException e) { | |
e.printStackTrace(); | |
} | |
} | |
public static void ConvertXmlToXlsx() { | |
try { | |
XmlLoadOptions options = new XmlLoadOptions(); | |
options.setCheckDataValid(true); | |
Workbook wb = new Workbook("input.xml", options); | |
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
} | |
} |
Наведений вище код демонструє, як експортувати дані з заповнюваного PDF до Excel за допомогою Java. Він дозволяє розробнику налаштувати завантаження вихідного XML-файлу за допомогою різних методів та властивостей об’єкта XmlLoadOptions. Ви також можете використовувати метод setLoadFilter(LoadFilter value) для фільтрації даних під час завантаження з XML-файлу.
Ця стаття навчила нас процесу перетворення даних з форми PDF у файл Excel. Щоб вилучити вибране поле форми з певної сторінки, зверніться до статті про те, як Вилучити дані з форми PDF за допомогою Java.