Java를 사용하여 PDF 양식에서 데이터 추출하기

이 짧은 튜토리얼은 Java를 사용하여 PDF 양식에서 데이터를 추출하는 과정을 설명합니다. IDE 설정, 프로그램 작성 단계 목록 및 Java를 사용하여 PDF 양식에서 데이터를 내보내는 방법을 보여주는 샘플 코드가 포함되어 있습니다. 양식의 모든 필드 또는 선택한 필드에 접근하고 요구 사항에 따라 처리하는 방법에 대한 세부 정보도 제공됩니다.

Java를 사용하여 PDF 양식 필드에서 데이터 추출하는 단계

  1. 양식 데이터를 추출하기 위해 Aspose.PDF for Java를 사용하도록 IDE 설정
  2. 텍스트 상자 필드와 샘플 데이터가 포함된 PDF 파일 생성
  3. 양식 및 입력 필드가 포함된 PDF 파일을 Document 객체로 로드
  4. 로드된 문서에서 양식의 필드 컬렉션에 접근
  5. 모든 필드를 순회하고 전체 이름과 값을 콘솔에 표시

이 단계들은 Java를 사용하여 PDF에서 양식 필드를 추출하는 방법을 설명합니다. 양식 필드와 샘플 데이터가 포함된 PDF 파일을 생성하거나 양식 데이터가 포함된 기존 파일을 로드하세요. 문서의 Form 속성에서 필드 컬렉션에 접근하고 모든 필드를 순회하여 원하는 속성을 표시하세요.

Java를 사용하여 채울 수 있는 PDF 양식에서 데이터 추출하는 코드

import com.aspose.pdf.*;
public class Main {
public static void main(String[] args) throws Exception {
// Load Aspose PDF license
License license = new License();
license.setLicense("license.lic");
// Generate PDF with input fields
createPdfWithFields();
// Open and process the generated PDF file
Document pdfDocument = new Document("UserForm.pdf");
// Retrieve and display form fields
Field[] formFields = pdfDocument.getForm().getFields();
for (Field formField : formFields) {
System.out.println("Field Name: " + formField.getFullName());
System.out.println("Field Content: " + formField.getValue());
}
// Release resources
pdfDocument.close();
}
private static void createPdfWithFields() {
// Instantiate new PDF document
Document pdfFile = new Document();
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) {
Page newPage = pdfFile.getPages().add();
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) {
// Define a text input field
TextBoxField inputField = new TextBoxField(newPage,
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90));
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex);
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex);
// Attach field to the document form
pdfFile.getForm().add(inputField, pageIndex);
}
}
// Save document to disk
pdfFile.save("UserForm.pdf");
// Free resources
pdfFile.close();
}
}

이 코드는 Java를 사용하여 PDF 양식에서 데이터를 추출하는 방법을 보여줍니다. 양식의 다양한 속성에 접근할 수 있습니다. 예를 들어 필드의 대체 이름, 매핑 이름, 내용, 부분 이름, 활성 상태, 선택 상태 이름, 페이지 인덱스 등이 있습니다. 선택한 필드에만 접근하려면 필드 인덱스를 사용하세요. 예를 들어, 첫 번째 필드의 값을 가져오려면 formFields[1].getValue()를 사용하세요.

이 글에서는 PDF 파일의 양식을 처리했습니다. PDF 파일에서 글꼴을 추출하려면 Java를 사용하여 PDF에서 글꼴 추출하기 글을 참조하세요.

 한국인