Ten poradnik opisuje, jak eksportować dane z PDF do Excela za pomocą Java. Zawiera informacje dotyczące konfiguracji IDE, listę kroków oraz przykładowy kod pozwalający na wyodrębnianie danych z edytowalnego pliku PDF do Excela za pomocą Java. Proces ten obejmuje eksportowanie danych formularza PDF do pliku XML, a następnie załadowanie tego pliku do obiektu Workbook w celu zapisania go w formacie XLSX.
Kroki eksportowania pól PDF do Excela za pomocą Java
- Skonfiguruj IDE do pracy z Aspose.PDF i Aspose.Cells dla Java w celu eksportowania danych formularza PDF.
- Użyj obiektu Form z Aspose.PDF do załadowania pliku PDF zawierającego pola formularza.
- Wywołaj metodę Form.bindPdf(), aby powiązać plik PDF z obiektem Form.
- Utwórz FileOutputStream dla pliku wyjściowego XML.
- Wywołaj metodę Form.exportXml(), aby pobrać dane formularza i zapisać je w pliku XML.
- Użyj obiektu XmlLoadOptions z API Aspose.Cells do załadowania pliku XML.
- Załaduj obiekt Workbook, aby otworzyć plik XML i zapisać go jako plik XLSX.
Powyższe kroki pokazują, jak wyodrębnić pola PDF i przekonwertować je do Excela za pomocą Java. Najpierw dane formularza PDF są eksportowane do pliku XML za pomocą metody Form.exportXml() z biblioteki Aspose.PDF. Następnie plik XML jest ładowany do obiektu Workbook przy użyciu Aspose.Cells API i zapisywany jako plik Excela w formacie XLSX.
Kod do ekstrakcji danych z formularza PDF do Excela za pomocą Java
import com.aspose.pdf.Document; | |
import com.aspose.pdf.Field; | |
import com.aspose.pdf.License; | |
import com.aspose.pdf.WidgetAnnotation; | |
import com.aspose.pdf.facades.Form; | |
import com.aspose.cells.Workbook; | |
import com.aspose.cells.XmlLoadOptions; | |
import com.aspose.cells.SaveFormat; | |
import java.io.File; | |
import java.io.FileOutputStream; | |
import java.io.FileInputStream; | |
import java.io.IOException; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Set license for Aspose.PDF | |
License pdfLic = new License(); | |
try { | |
pdfLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
// Set license for Aspose.Cells | |
com.aspose.cells.License cellsLic = new com.aspose.cells.License(); | |
try { | |
cellsLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
ExportDataToXml(); | |
ConvertXmlToXlsx(); | |
} | |
public static void ExportDataToXml() { | |
try { | |
Form pdfForm = new Form(); | |
pdfForm.bindPdf("TextBox_out.pdf"); | |
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml")); | |
pdfForm.exportXml(xmlOutputStream); | |
xmlOutputStream.close(); | |
} catch (IOException e) { | |
e.printStackTrace(); | |
} | |
} | |
public static void ConvertXmlToXlsx() { | |
try { | |
XmlLoadOptions options = new XmlLoadOptions(); | |
options.setCheckDataValid(true); | |
Workbook wb = new Workbook("input.xml", options); | |
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
} | |
} |
Powyższy kod demonstruje, jak eksportować dane z edytowalnego PDF do Excela za pomocą Java. Deweloper może dostosować proces ładowania pliku XML za pomocą różnych metod i właściwości obiektu XmlLoadOptions. Można także użyć metody setLoadFilter(LoadFilter value), aby filtrować dane podczas ich ładowania z pliku XML.
Ten artykuł pokazał proces konwersji danych formularza PDF do pliku Excela. Jeśli chcesz wyodrębnić konkretne pole formularza z określonej strony, zapoznaj się z artykułem dotyczącym wyodrębniania danych z formularza PDF za pomocą Java.