Java-ի միջոցով PDF ձևից տվյալների արտահանում Excel

Այս ուսումնական ձեռնարկը նկարագրում է, թե ինչպես Java-ի միջոցով PDF ձևից տվյալները արտահանել Excel: Այն պարունակում է տեղեկատվություն IDE-ի կարգավորումների, քայլերի ցանկի և Java-ի միջոցով լրացվող PDF-ից տվյալները Excel-ում արտահանելու նմուշային կոդի մասին: Դուք կստանաք տեղեկատվություն PDF ձևի տվյալները XML ֆայլում արտահանելու և այնուհետև XML ֆայլը Workbook-ում բեռնելու և այն XLSX ֆայլի տեսքով պահելու մասին:

Քայլեր՝ PDF դաշտերը Excel-ում արտահանելու համար Java-ի միջոցով

  1. Սահմանեք IDE-ն՝ Aspose.PDF և Aspose.Cells for Java-ի օգտագործման համար՝ PDF ձևի տվյալները արտահանելու համար
  2. Օգտագործեք Aspose.PDF-ից Form օբյեկտը՝ PDF ֆայլը դաշտերով բեռնելու համար
  3. Օգտագործեք Form.bindPdf() մեթոդը՝ PDF-ը Form օբյեկտի հետ կապելու համար
  4. Ստեղծեք FileOutputStream ելքային XML ֆայլի համար
  5. Կանչեք Form.exportXml() մեթոդը՝ ձևի տվյալները ստանալու և XML ֆայլում լրացնելու համար
  6. Օգտագործեք Aspose.Cells API-ից XmlLoadOptions օբյեկտը՝ XML ֆայլը բեռնելու համար
  7. Բեռնեք Workbook դասի օբյեկտը՝ XML ֆայլը բեռնելու և այն XLSX ֆայլի տեսքով պահելու համար

Վերոնշյալ քայլերը ամփոփում են, թե ինչպես Java-ի միջոցով PDF դաշտերը Excel-ում արտահանել: Սկզբում տեղափոխեք PDF ձևի տվյալները XML ֆայլի մեջ՝ օգտագործելով Aspose.PDF API-ն, որն ունի Form.exportXml() մեթոդը այս նպատակի համար: Վերջում օգտագործեք Aspose.Cells API-ն՝ այս XML ֆայլը Workbook օբյեկտում բեռնելու և այն Excel ֆայլի XLSX ձևաչափով պահելու համար:

Կոդ՝ PDF ձևից տվյալները Excel-ում արտահանելու համար Java-ի միջոցով

import com.aspose.pdf.Document;
import com.aspose.pdf.Field;
import com.aspose.pdf.License;
import com.aspose.pdf.WidgetAnnotation;
import com.aspose.pdf.facades.Form;
import com.aspose.cells.Workbook;
import com.aspose.cells.XmlLoadOptions;
import com.aspose.cells.SaveFormat;
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileInputStream;
import java.io.IOException;
public class Main {
public static void main(String[] args) throws Exception {
// Set license for Aspose.PDF
License pdfLic = new License();
try {
pdfLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
// Set license for Aspose.Cells
com.aspose.cells.License cellsLic = new com.aspose.cells.License();
try {
cellsLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
ExportDataToXml();
ConvertXmlToXlsx();
}
public static void ExportDataToXml() {
try {
Form pdfForm = new Form();
pdfForm.bindPdf("TextBox_out.pdf");
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml"));
pdfForm.exportXml(xmlOutputStream);
xmlOutputStream.close();
} catch (IOException e) {
e.printStackTrace();
}
}
public static void ConvertXmlToXlsx() {
try {
XmlLoadOptions options = new XmlLoadOptions();
options.setCheckDataValid(true);
Workbook wb = new Workbook("input.xml", options);
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX);
} catch (Exception e) {
e.printStackTrace();
}
}
}

Վերոնշյալ կոդը ցույց է տալիս, թե ինչպես Java-ի միջոցով լրացվող PDF-ից տվյալները Excel-ում արտահանել: Այն թույլ է տալիս մշակողին հարմարեցնել ելքային XML ֆայլի բեռնումը՝ օգտագործելով XmlLoadOptions օբյեկտի տարբեր մեթոդներ և հատկություններ: Դուք կարող եք նաև օգտագործել setLoadFilter(LoadFilter value) մեթոդը՝ տվյալները ֆիլտրելու համար XML ֆայլից բեռնելիս:

Այս հոդվածը մեզ սովորեցրեց PDF ձևի տվյալները Excel ֆայլի վերածելու գործընթացը: Որոշակի էջից ընտրված ձևի դաշտը արտահանելու համար տե՛ս Java-ի միջոցով PDF ձևից տվյալների արտահանում հոդվածը:

 Հայերեն