Экспорт данных из формы PDF в Excel с помощью Java

Этот учебник описывает, как экспортировать данные из PDF в Excel с помощью Java. В нем представлена информация о настройке IDE, последовательность действий и пример кода для извлечения данных из заполняемого PDF в Excel с помощью Java. Данные из формы PDF сначала экспортируются в XML-файл, затем загружаются в объект Workbook и сохраняются в формате XLSX.

Шаги по экспорту полей PDF в Excel с помощью Java

  1. Настройте IDE для работы с Aspose.PDF и Aspose.Cells для Java для экспорта данных формы PDF.
  2. Используйте объект Form из Aspose.PDF для загрузки PDF-файла с полями формы.
  3. Вызовите метод Form.bindPdf(), чтобы связать PDF с объектом Form.
  4. Создайте FileOutputStream для выходного XML-файла.
  5. Вызовите метод Form.exportXml(), чтобы извлечь данные формы и сохранить их в XML-файл.
  6. Используйте объект XmlLoadOptions из API Aspose.Cells для загрузки XML-файла.
  7. Загрузите объект Workbook, чтобы открыть XML-файл и сохранить его в формате XLSX.

Эти шаги демонстрируют, как извлечь поля PDF и преобразовать их в Excel с помощью Java. Сначала данные формы PDF экспортируются в XML-файл с использованием метода Form.exportXml() из библиотеки Aspose.PDF. Затем API Aspose.Cells используется для загрузки XML-файла в объект Workbook и сохранения его в формате XLSX.

Код для извлечения данных из формы PDF в Excel с помощью Java

import com.aspose.pdf.Document;
import com.aspose.pdf.Field;
import com.aspose.pdf.License;
import com.aspose.pdf.WidgetAnnotation;
import com.aspose.pdf.facades.Form;
import com.aspose.cells.Workbook;
import com.aspose.cells.XmlLoadOptions;
import com.aspose.cells.SaveFormat;
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileInputStream;
import java.io.IOException;
public class Main {
public static void main(String[] args) throws Exception {
// Set license for Aspose.PDF
License pdfLic = new License();
try {
pdfLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
// Set license for Aspose.Cells
com.aspose.cells.License cellsLic = new com.aspose.cells.License();
try {
cellsLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
ExportDataToXml();
ConvertXmlToXlsx();
}
public static void ExportDataToXml() {
try {
Form pdfForm = new Form();
pdfForm.bindPdf("TextBox_out.pdf");
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml"));
pdfForm.exportXml(xmlOutputStream);
xmlOutputStream.close();
} catch (IOException e) {
e.printStackTrace();
}
}
public static void ConvertXmlToXlsx() {
try {
XmlLoadOptions options = new XmlLoadOptions();
options.setCheckDataValid(true);
Workbook wb = new Workbook("input.xml", options);
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX);
} catch (Exception e) {
e.printStackTrace();
}
}
}

Приведенный выше код демонстрирует, как экспортировать данные из заполняемого PDF в Excel с помощью Java. Разработчик может настраивать загрузку выходного XML-файла, используя различные методы и свойства объекта XmlLoadOptions. Также можно использовать метод setLoadFilter(LoadFilter value) для фильтрации данных при загрузке из XML-файла.

В этой статье был рассмотрен процесс преобразования данных формы PDF в файл Excel. Если вам нужно извлечь конкретное поле формы с определенной страницы, ознакомьтесь со статьей о извлечении данных из формы PDF с помощью Java.

 Русский