C#을 사용하여 PDF 양식에서 데이터 추출하기

이 문서는 C#을 사용하여 PDF 양식에서 데이터를 추출하는 방법을 안내합니다. IDE 설정 방법, 단계별 절차, 그리고 C#을 사용하여 PDF에서 양식 필드를 추출하는 방법을 설명하는 샘플 코드가 포함되어 있습니다. 로드된 PDF에서 필드 이름과 값을 가져오는 과정을 설명합니다.

C#을 사용하여 PDF 양식 필드에서 데이터 추출하는 방법

  1. Aspose.PDF for .NET을 사용하여 양식 데이터를 읽을 환경 설정하기
  2. 빈 PDF 문서를 생성하고, 여러 페이지와 테스트용 데이터를 포함한 필드를 추가하기
  3. 필드가 포함된 PDF 파일을 Document 객체로 로드하기
  4. 로드된 PDF에서 Form 객체에 접근하기
  5. 양식 내의 각 필드를 반복하며 정보 가져오기
  6. 필드의 부분 이름과 값을 출력하기

위 단계들은 C#을 사용하여 PDF 양식에서 데이터를 내보내는 과정을 요약한 것입니다. PDF 파일을 생성하고 필드에 값을 추가하거나, 기존 PDF 파일을 로드하여 양식 필드에 접근할 수 있습니다. Document.Form 객체를 사용하면 필드 목록을 가져오고 필드 이름 및 값을 출력할 수 있습니다.

C#을 사용하여 작성 가능한 PDF에서 데이터 추출하는 코드

using Aspose.Pdf;
License lic = new License();
lic.SetLicense("license.lic");
AddTextBoxFieldToPdf();
// Open PDF document
using (var pdfDoc = new Document("TextBox_out.pdf"))
{
// Get values from all fields
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form)
{
Console.WriteLine("Field Title : {0} ", field.PartialName);
Console.WriteLine("Field Data : {0} ", field.Value);
}
}
void AddTextBoxFieldToPdf()
{
// Open PDF document
using (var document = new Aspose.Pdf.Document())
{
for(int iPage = 1; iPage < 5; iPage++)
{
var page = document.Pages.Add();
for(int i = 1; i <= 5; i++)
{
// Create a field
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page,
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100));
textBoxField.PartialName = $"textbox{iPage}{i}";
textBoxField.Value = $"Text Box {iPage}{i} Value";
document.Form.Add(textBoxField, iPage);
}
}
// Save PDF document
document.Save("TextBox_out.pdf");
}
}

이 코드는 C#을 사용하여 PDF 양식에서 데이터를 추출하는 방법을 보여줍니다. 텍스트 상자, 라디오 버튼, 콤보 박스를 포함한 모든 컨트롤에 접근할 수 있습니다. Form 객체에는 PDF의 모든 필드가 포함되어 있으며, 로드된 PDF 파일의 모든 페이지에서 필드 정보를 가져올 수 있습니다.

이 문서에서는 PDF 파일의 모든 필드에 접근하는 방법을 배웠습니다. PDF에서 글꼴을 추출하는 방법에 대한 자세한 내용은 C#을 사용하여 PDF에서 글꼴 추출하기 문서를 참조하세요.

 한국인