이 튜토리얼에서는 Java를 사용하여 PDF 양식 데이터를 Excel로 내보내는 방법을 설명합니다. IDE 설정 방법, 단계별 과정, 그리고 작성 가능한 PDF에서 Excel로 데이터를 추출하는 Java 코드 예제를 제공합니다. PDF 양식 데이터를 XML 파일로 내보낸 후, XML 파일을 Workbook 객체에 로드하여 XLSX 파일로 저장하는 방법을 배울 수 있습니다.
Java를 사용하여 PDF 필드를 Excel로 내보내는 단계
- Aspose.PDF 및 Aspose.Cells for Java를 IDE에 설정하여 PDF 양식 데이터를 내보낼 준비를 합니다.
- Aspose.PDF의 Form 객체를 사용하여 양식 필드가 포함된 PDF 파일을 로드합니다.
- Form.bindPdf() 메서드를 호출하여 PDF를 Form 객체에 연결합니다.
- 출력 XML 파일을 위한 FileOutputStream을 생성합니다.
- Form.exportXml() 메서드를 호출하여 양식 데이터를 추출하고 XML 파일에 저장합니다.
- Aspose.Cells API의 XmlLoadOptions 객체를 사용하여 XML 파일을 로드합니다.
- Workbook 객체를 로드하여 XML 파일을 읽고 XLSX 파일로 저장합니다.
위 단계는 Java를 사용하여 PDF 필드를 Excel로 추출하는 방법을 요약한 것입니다. 먼저, Aspose.PDF API의 Form.exportXml() 메서드를 사용하여 PDF 양식 데이터를 XML 파일로 변환합니다. 그런 다음, Aspose.Cells API를 사용하여 XML 파일을 Workbook 객체에 로드하고 Excel 형식(XLSX)으로 저장합니다.
Java를 사용하여 PDF 양식 데이터를 Excel로 추출하는 코드
import com.aspose.pdf.Document; | |
import com.aspose.pdf.Field; | |
import com.aspose.pdf.License; | |
import com.aspose.pdf.WidgetAnnotation; | |
import com.aspose.pdf.facades.Form; | |
import com.aspose.cells.Workbook; | |
import com.aspose.cells.XmlLoadOptions; | |
import com.aspose.cells.SaveFormat; | |
import java.io.File; | |
import java.io.FileOutputStream; | |
import java.io.FileInputStream; | |
import java.io.IOException; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Set license for Aspose.PDF | |
License pdfLic = new License(); | |
try { | |
pdfLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
// Set license for Aspose.Cells | |
com.aspose.cells.License cellsLic = new com.aspose.cells.License(); | |
try { | |
cellsLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
ExportDataToXml(); | |
ConvertXmlToXlsx(); | |
} | |
public static void ExportDataToXml() { | |
try { | |
Form pdfForm = new Form(); | |
pdfForm.bindPdf("TextBox_out.pdf"); | |
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml")); | |
pdfForm.exportXml(xmlOutputStream); | |
xmlOutputStream.close(); | |
} catch (IOException e) { | |
e.printStackTrace(); | |
} | |
} | |
public static void ConvertXmlToXlsx() { | |
try { | |
XmlLoadOptions options = new XmlLoadOptions(); | |
options.setCheckDataValid(true); | |
Workbook wb = new Workbook("input.xml", options); | |
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
} | |
} |
위 코드는 Java를 사용하여 작성 가능한 PDF에서 Excel로 데이터를 내보내는 방법을 보여줍니다. XmlLoadOptions 객체의 다양한 메서드와 속성을 사용하여 출력 XML 파일의 로딩을 사용자 지정할 수 있습니다. 또한, setLoadFilter(LoadFilter value) 메서드를 사용하여 XML 파일에서 데이터를 로드할 때 필터링할 수도 있습니다.
이 기사에서는 PDF 양식 데이터를 Excel 파일로 변환하는 과정을 설명했습니다. 특정 페이지에서 선택한 필드만 추출하려면 Java를 사용하여 PDF 양식에서 데이터 추출하는 방법 기사를 참조하세요.