Този урок описва как да експортирате данни от PDF форма в Excel с Java. Той съдържа информация за настройка на IDE, списък със стъпки и примерен код за извличане на данни от попълваема PDF форма в Excel с Java. Ще научите как да експортирате данните от PDF формуляра в XML файл и след това да заредите този XML файл в Workbook, за да го запазите като XLSX файл.
Стъпки за експортиране на PDF полета в Excel с Java
- Настройте IDE за използване на Aspose.PDF и Aspose.Cells за Java за експортиране на данни от PDF форма
- Използвайте Form обекта от Aspose.PDF, за да заредите PDF файл с полета за попълване
- Извикайте метода Form.bindPdf(), за да свържете PDF файла с обекта Form
- Създайте FileOutputStream за изходния XML файл
- Извикайте метода Form.exportXml(), за да извлечете данните от формуляра и да ги запишете в XML файл
- Използвайте обекта XmlLoadOptions от Aspose.Cells API за зареждане на XML файла
- Заредете обекта Workbook, за да обработи XML файла и да го запише като XLSX файл
Горните стъпки обобщават как да извлечете полета от PDF към Excel с Java. Първоначално експортирайте данните от PDF формуляра в XML файл, като използвате API-то Aspose.PDF и метода Form.exportXml(). Накрая използвайте API-то Aspose.Cells, за да заредите този XML файл в обект Workbook и да го запишете във формат на Excel файл (XLSX).
Код за извличане на данни от PDF форма в Excel с Java
import com.aspose.pdf.Document; | |
import com.aspose.pdf.Field; | |
import com.aspose.pdf.License; | |
import com.aspose.pdf.WidgetAnnotation; | |
import com.aspose.pdf.facades.Form; | |
import com.aspose.cells.Workbook; | |
import com.aspose.cells.XmlLoadOptions; | |
import com.aspose.cells.SaveFormat; | |
import java.io.File; | |
import java.io.FileOutputStream; | |
import java.io.FileInputStream; | |
import java.io.IOException; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Set license for Aspose.PDF | |
License pdfLic = new License(); | |
try { | |
pdfLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
// Set license for Aspose.Cells | |
com.aspose.cells.License cellsLic = new com.aspose.cells.License(); | |
try { | |
cellsLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
ExportDataToXml(); | |
ConvertXmlToXlsx(); | |
} | |
public static void ExportDataToXml() { | |
try { | |
Form pdfForm = new Form(); | |
pdfForm.bindPdf("TextBox_out.pdf"); | |
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml")); | |
pdfForm.exportXml(xmlOutputStream); | |
xmlOutputStream.close(); | |
} catch (IOException e) { | |
e.printStackTrace(); | |
} | |
} | |
public static void ConvertXmlToXlsx() { | |
try { | |
XmlLoadOptions options = new XmlLoadOptions(); | |
options.setCheckDataValid(true); | |
Workbook wb = new Workbook("input.xml", options); | |
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
} | |
} |
Горният код демонстрира как да експортирате данни от попълваема PDF форма в Excel с Java. Той позволява на разработчиците да персонализират зареждането на изходния XML файл чрез различни методи и свойства в обекта XmlLoadOptions. Можете също така да използвате метода setLoadFilter(LoadFilter value), за да филтрирате данните при зареждане от XML файла.
Тази статия ни научи на процеса на преобразуване на данни от PDF формуляр в Excel файл. За да извлечете избрано поле от формуляра на конкретна страница, вижте статията за Извличане на данни от PDF форма с Java.