C# を使用して PDF フォームからデータを抽出する

この記事では、PDF フォームからデータを C# を使用して抽出する方法を解説します。IDE の設定方法、手順のリスト、および C# を使用して PDF からフォームフィールドを抽出する方法 に関するサンプルコードが含まれています。PDF に含まれるフィールド名や値を取得する手順を詳しく説明します。

C# を使用して PDF フォームフィールドからデータを抽出する手順

  1. Aspose.PDF for .NET を使用してフォームデータを読み取る環境を設定する
  2. 空の PDF ドキュメントを作成し、複数のページとテスト用のデータを含むフィールドを追加する
  3. フィールドを含む PDF ファイルを Document オブジェクトに読み込む
  4. 読み込んだ PDF の Form オブジェクトにアクセスする
  5. フォーム内の各フィールドを解析し、情報にアクセスする
  6. フィールドの部分名と値を表示する

これらの手順により、C# を使用して PDF フォームからデータをエクスポートする 方法を理解できます。PDF ファイルを作成して値を含むフィールドを追加するか、既存の PDF ファイルを読み込んでフォームフィールドにアクセスできます。Document.Form オブジェクトを使用すると、フィールドの一覧を取得し、その名前と値を表示できます。

C# を使用して記入可能な PDF からデータを抽出するコード

using Aspose.Pdf;
License lic = new License();
lic.SetLicense("license.lic");
AddTextBoxFieldToPdf();
// Open PDF document
using (var pdfDoc = new Document("TextBox_out.pdf"))
{
// Get values from all fields
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form)
{
Console.WriteLine("Field Title : {0} ", field.PartialName);
Console.WriteLine("Field Data : {0} ", field.Value);
}
}
void AddTextBoxFieldToPdf()
{
// Open PDF document
using (var document = new Aspose.Pdf.Document())
{
for(int iPage = 1; iPage < 5; iPage++)
{
var page = document.Pages.Add();
for(int i = 1; i <= 5; i++)
{
// Create a field
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page,
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100));
textBoxField.PartialName = $"textbox{iPage}{i}";
textBoxField.Value = $"Text Box {iPage}{i} Value";
document.Form.Add(textBoxField, iPage);
}
}
// Save PDF document
document.Save("TextBox_out.pdf");
}
}

このコードは、C# を使用して PDF フォームからデータを抽出する方法 を示しています。フォーム内のすべてのコントロール(テキストボックス、ラジオボタン、コンボボックスなど)にアクセスできます。Form オブジェクトには PDF 内のすべてのフィールドが含まれており、読み込んだ PDF のすべてのページのフィールドにアクセスできます。

この記事では、PDF ファイル内のすべてのフィールドにアクセスする方法を学びました。PDF からフォントを抽出する方法については、C# を使用して PDF からフォントを抽出する 記事をご覧ください。

 日本語