この記事では、PDF フォームからデータを C# を使用して抽出する方法を解説します。IDE の設定方法、手順のリスト、および C# を使用して PDF からフォームフィールドを抽出する方法 に関するサンプルコードが含まれています。PDF に含まれるフィールド名や値を取得する手順を詳しく説明します。
C# を使用して PDF フォームフィールドからデータを抽出する手順
- Aspose.PDF for .NET を使用してフォームデータを読み取る環境を設定する
- 空の PDF ドキュメントを作成し、複数のページとテスト用のデータを含むフィールドを追加する
- フィールドを含む PDF ファイルを Document オブジェクトに読み込む
- 読み込んだ PDF の Form オブジェクトにアクセスする
- フォーム内の各フィールドを解析し、情報にアクセスする
- フィールドの部分名と値を表示する
これらの手順により、C# を使用して PDF フォームからデータをエクスポートする 方法を理解できます。PDF ファイルを作成して値を含むフィールドを追加するか、既存の PDF ファイルを読み込んでフォームフィールドにアクセスできます。Document.Form オブジェクトを使用すると、フィールドの一覧を取得し、その名前と値を表示できます。
C# を使用して記入可能な PDF からデータを抽出するコード
using Aspose.Pdf; | |
License lic = new License(); | |
lic.SetLicense("license.lic"); | |
AddTextBoxFieldToPdf(); | |
// Open PDF document | |
using (var pdfDoc = new Document("TextBox_out.pdf")) | |
{ | |
// Get values from all fields | |
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form) | |
{ | |
Console.WriteLine("Field Title : {0} ", field.PartialName); | |
Console.WriteLine("Field Data : {0} ", field.Value); | |
} | |
} | |
void AddTextBoxFieldToPdf() | |
{ | |
// Open PDF document | |
using (var document = new Aspose.Pdf.Document()) | |
{ | |
for(int iPage = 1; iPage < 5; iPage++) | |
{ | |
var page = document.Pages.Add(); | |
for(int i = 1; i <= 5; i++) | |
{ | |
// Create a field | |
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page, | |
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100)); | |
textBoxField.PartialName = $"textbox{iPage}{i}"; | |
textBoxField.Value = $"Text Box {iPage}{i} Value"; | |
document.Form.Add(textBoxField, iPage); | |
} | |
} | |
// Save PDF document | |
document.Save("TextBox_out.pdf"); | |
} | |
} |
このコードは、C# を使用して PDF フォームからデータを抽出する方法 を示しています。フォーム内のすべてのコントロール(テキストボックス、ラジオボタン、コンボボックスなど)にアクセスできます。Form オブジェクトには PDF 内のすべてのフィールドが含まれており、読み込んだ PDF のすべてのページのフィールドにアクセスできます。
この記事では、PDF ファイル内のすべてのフィールドにアクセスする方法を学びました。PDF からフォントを抽出する方法については、C# を使用して PDF からフォントを抽出する 記事をご覧ください。