Этот учебник описывает, как экспортировать данные из PDF в Excel с помощью Java. В нем представлена информация о настройке IDE, последовательность действий и пример кода для извлечения данных из заполняемого PDF в Excel с помощью Java. Данные из формы PDF сначала экспортируются в XML-файл, затем загружаются в объект Workbook и сохраняются в формате XLSX.
Шаги по экспорту полей PDF в Excel с помощью Java
- Настройте IDE для работы с Aspose.PDF и Aspose.Cells для Java для экспорта данных формы PDF.
- Используйте объект Form из Aspose.PDF для загрузки PDF-файла с полями формы.
- Вызовите метод Form.bindPdf(), чтобы связать PDF с объектом Form.
- Создайте FileOutputStream для выходного XML-файла.
- Вызовите метод Form.exportXml(), чтобы извлечь данные формы и сохранить их в XML-файл.
- Используйте объект XmlLoadOptions из API Aspose.Cells для загрузки XML-файла.
- Загрузите объект Workbook, чтобы открыть XML-файл и сохранить его в формате XLSX.
Эти шаги демонстрируют, как извлечь поля PDF и преобразовать их в Excel с помощью Java. Сначала данные формы PDF экспортируются в XML-файл с использованием метода Form.exportXml() из библиотеки Aspose.PDF. Затем API Aspose.Cells используется для загрузки XML-файла в объект Workbook и сохранения его в формате XLSX.
Код для извлечения данных из формы PDF в Excel с помощью Java
import com.aspose.pdf.Document; | |
import com.aspose.pdf.Field; | |
import com.aspose.pdf.License; | |
import com.aspose.pdf.WidgetAnnotation; | |
import com.aspose.pdf.facades.Form; | |
import com.aspose.cells.Workbook; | |
import com.aspose.cells.XmlLoadOptions; | |
import com.aspose.cells.SaveFormat; | |
import java.io.File; | |
import java.io.FileOutputStream; | |
import java.io.FileInputStream; | |
import java.io.IOException; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Set license for Aspose.PDF | |
License pdfLic = new License(); | |
try { | |
pdfLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
// Set license for Aspose.Cells | |
com.aspose.cells.License cellsLic = new com.aspose.cells.License(); | |
try { | |
cellsLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
ExportDataToXml(); | |
ConvertXmlToXlsx(); | |
} | |
public static void ExportDataToXml() { | |
try { | |
Form pdfForm = new Form(); | |
pdfForm.bindPdf("TextBox_out.pdf"); | |
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml")); | |
pdfForm.exportXml(xmlOutputStream); | |
xmlOutputStream.close(); | |
} catch (IOException e) { | |
e.printStackTrace(); | |
} | |
} | |
public static void ConvertXmlToXlsx() { | |
try { | |
XmlLoadOptions options = new XmlLoadOptions(); | |
options.setCheckDataValid(true); | |
Workbook wb = new Workbook("input.xml", options); | |
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
} | |
} |
Приведенный выше код демонстрирует, как экспортировать данные из заполняемого PDF в Excel с помощью Java. Разработчик может настраивать загрузку выходного XML-файла, используя различные методы и свойства объекта XmlLoadOptions. Также можно использовать метод setLoadFilter(LoadFilter value) для фильтрации данных при загрузке из XML-файла.
В этой статье был рассмотрен процесс преобразования данных формы PDF в файл Excel. Если вам нужно извлечь конкретное поле формы с определенной страницы, ознакомьтесь со статьей о извлечении данных из формы PDF с помощью Java.