Hướng dẫn nhanh này sẽ hướng dẫn bạn cách xuất dữ liệu từ biểu mẫu PDF sang Excel bằng C#. Nó bao gồm tất cả các chi tiết để thiết lập môi trường bằng cách sử dụng Aspose.PDF và Aspose.Cells để xuất các trường PDF sang Excel bằng C#. Các bước chi tiết được chia sẻ để xuất dữ liệu từ PDF bằng một sản phẩm và lưu nó dưới dạng tệp Excel bằng một sản phẩm khác.
Các bước để xuất dữ liệu từ biểu mẫu Adobe sang Excel bằng C#
- Thiết lập môi trường để sử dụng Aspose.PDF và Aspose.Cells cho .NET
- Tạo một đối tượng của lớp Form trong Aspose.PDF và liên kết nó với tệp PDF nguồn chứa biểu mẫu
- Tạo một đối tượng Stream cho tệp XML và gọi phương thức Form.ExportXml() để xuất dữ liệu biểu mẫu sang tệp XML
- Tạo một đối tượng của lớp XmlLoadOptions từ Aspose.Cells
- Tải tệp XML vào đối tượng Workbook bằng Aspose.Cells
- Lưu Workbook dưới dạng tệp XLSX để nhận dữ liệu biểu mẫu từ XML
Các bước này tóm tắt quy trình để xuất dữ liệu từ biểu mẫu PDF sang Excel bằng C#. Đầu tiên, tải PDF đầu vào chứa biểu mẫu bằng cách sử dụng Form.BindPdf() và xuất nó sang tệp XML trên đĩa bằng phương thức Form.ExportXml(). Trong bước tiếp theo, tải tệp XML bằng đối tượng Aspose.Cells.Workbook và lưu Workbook dưới dạng tệp XLSX.
Mã để xuất PDF có thể điền sang Excel bằng C#
using Aspose.Pdf; | |
using Aspose.Cells; | |
Aspose.Pdf.License pdfLic = new Aspose.Pdf.License(); | |
pdfLic.SetLicense("license.lic"); | |
Aspose.Cells.License cellsLic = new Aspose.Cells.License(); | |
cellsLic.SetLicense("license.lic"); | |
ExportDataToXml(); | |
ConvertXmlToXlsx(); | |
void ExportDataToXml() | |
{ | |
using (var pdfForm = new Aspose.Pdf.Facades.Form()) | |
{ | |
// Bind PDF document | |
pdfForm.BindPdf("TextBox_out.pdf"); | |
// Create XML file | |
using (var xmlOutputStream = new FileStream("input.xml", FileMode.Create)) | |
{ | |
// Export data | |
pdfForm.ExportXml(xmlOutputStream); | |
} | |
} | |
} | |
void ConvertXmlToXlsx() | |
{ | |
Aspose.Cells.LoadOptions options = new Aspose.Cells.XmlLoadOptions(); | |
options.CheckDataValid = true; | |
Workbook wb = new Workbook("input.xml", options); | |
wb.Save("XmlToXlsx.xlsx", Aspose.Cells.SaveFormat.Xlsx); | |
} |
Mã mẫu trên mô tả cách trích xuất dữ liệu từ PDF có thể điền sang Excel bằng C#. Chúng tôi đã sử dụng một đối tượng của lớp Aspose.Pdf.Facades.Form, chứa phương thức BindPdf() để liên kết PDF với nó. Bạn có thể sử dụng đối tượng XmlLoadOptions để tùy chỉnh việc tải tệp XML mới được tạo, chẳng hạn như kiểm tra các hạn chế của Excel đối với kích thước tải, cờ để quyết định chuyển đổi giá trị số thành số hoặc ngày trong tệp Excel và kiểm soát nhiều tham số khác.
Hướng dẫn này đã dạy chúng ta cách đọc dữ liệu từ biểu mẫu PDF vào tệp Excel. Để truy cập các trường riêng lẻ trong biểu mẫu, hãy tham khảo bài viết Trích xuất dữ liệu từ biểu mẫu PDF bằng C#.