Eksport danych z formularza PDF do Excela przy użyciu C#

Ten krótki samouczek wyjaśnia, jak wyeksportować dane z formularza PDF do Excela przy użyciu C#. Zawiera wszystkie szczegóły dotyczące konfiguracji środowiska przy użyciu Aspose.PDF i Aspose.Cells, aby wyeksportować pola PDF do Excela za pomocą C#. Udostępniono szczegółowe kroki do eksportu danych z PDF przy użyciu jednego produktu i zapisania ich jako plik Excela przy użyciu drugiego produktu.

Kroki do eksportu danych formularza Adobe do Excela przy użyciu C#

  1. Skonfiguruj środowisko do używania Aspose.PDF i Aspose.Cells dla .NET
  2. Utwórz obiekt klasy Form w Aspose.PDF i powiąż go z źródłowym plikiem PDF zawierającym formularz
  3. Utwórz obiekt strumienia dla pliku XML i wywołaj metodę Form.ExportXml(), aby wyeksportować dane formularza do pliku XML
  4. Utwórz obiekt klasy XmlLoadOptions z Aspose.Cells
  5. Załaduj plik XML do obiektu Workbook przy użyciu Aspose.Cells
  6. Zapisz skoroszyt jako plik XLSX, aby umieścić w nim dane formularza z XML

Te kroki podsumowują proces eksportu danych formularza PDF do Excela przy użyciu C#. Najpierw załaduj wejściowy PDF z formularzem przy użyciu Form.BindPdf() i wyeksportuj go do pliku XML na dysku za pomocą metody Form.ExportXml(). W następnym kroku załaduj plik XML przy użyciu obiektu Aspose.Cells.Workbook i zapisz skoroszyt jako plik XLSX.

Kod do eksportu edytowalnego PDF do Excela przy użyciu C#

using Aspose.Pdf;
using Aspose.Cells;
Aspose.Pdf.License pdfLic = new Aspose.Pdf.License();
pdfLic.SetLicense("license.lic");
Aspose.Cells.License cellsLic = new Aspose.Cells.License();
cellsLic.SetLicense("license.lic");
ExportDataToXml();
ConvertXmlToXlsx();
void ExportDataToXml()
{
using (var pdfForm = new Aspose.Pdf.Facades.Form())
{
// Bind PDF document
pdfForm.BindPdf("TextBox_out.pdf");
// Create XML file
using (var xmlOutputStream = new FileStream("input.xml", FileMode.Create))
{
// Export data
pdfForm.ExportXml(xmlOutputStream);
}
}
}
void ConvertXmlToXlsx()
{
Aspose.Cells.LoadOptions options = new Aspose.Cells.XmlLoadOptions();
options.CheckDataValid = true;
Workbook wb = new Workbook("input.xml", options);
wb.Save("XmlToXlsx.xlsx", Aspose.Cells.SaveFormat.Xlsx);
}

Powyższy przykład kodu opisuje, jak wyodrębnić dane z edytowalnego PDF do Excela przy użyciu C#. Użyliśmy obiektu klasy Aspose.Pdf.Facades.Form, który zawiera metodę BindPdf() do powiązania PDF z nim. Możesz wykorzystać obiekt XmlLoadOptions do dostosowania ładowania nowo utworzonego pliku XML, na przykład sprawdzając ograniczenia Excela dotyczące rozmiaru ładowania, flagę decydującą o konwersji wartości liczbowych na liczby lub daty w pliku Excela oraz kontrolując wiele innych parametrów.

Ten samouczek nauczył nas, jak odczytywać dane formularza PDF do pliku Excela. Aby uzyskać dostęp do poszczególnych pól w formularzu, zapoznaj się z artykułem na temat Wyodrębniania danych z formularza PDF przy użyciu C#.

 Polski