Цей короткий посібник описує процес витягнення даних з PDF форми за допомогою Java. У ньому наведено деталі щодо налаштування IDE, список кроків для написання програми та зразок коду, який демонструє, як експортувати дані з PDF-форми за допомогою Java. Наведено деталі щодо доступу до всіх або вибраних полів у формі та їх обробки відповідно до потреб.
Кроки для витягнення даних з полів PDF-форми за допомогою Java
- Налаштуйте IDE для використання Aspose.PDF for Java для витягнення даних форми
- Створіть PDF-файл із текстовими полями та зразками даних
- Завантажте PDF-файл із формою та полями введення в об’єкт Document
- Отримайте доступ до колекції полів у формі з завантаженого документа
- Перегляньте всі поля та отримайте повну назву та значення для відображення на консолі
Ці кроки пояснюють, як витягнути поля форми з PDF за допомогою Java. Створіть PDF-файл із полями форми та зразками даних або завантажте існуючий файл із даними форми. Отримайте доступ до колекції полів із властивості Form документа, перегляньте всі поля та відобразіть потрібні властивості.
Код для витягнення даних із заповнюваної PDF-форми за допомогою Java
import com.aspose.pdf.*; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Load Aspose PDF license | |
License license = new License(); | |
license.setLicense("license.lic"); | |
// Generate PDF with input fields | |
createPdfWithFields(); | |
// Open and process the generated PDF file | |
Document pdfDocument = new Document("UserForm.pdf"); | |
// Retrieve and display form fields | |
Field[] formFields = pdfDocument.getForm().getFields(); | |
for (Field formField : formFields) { | |
System.out.println("Field Name: " + formField.getFullName()); | |
System.out.println("Field Content: " + formField.getValue()); | |
} | |
// Release resources | |
pdfDocument.close(); | |
} | |
private static void createPdfWithFields() { | |
// Instantiate new PDF document | |
Document pdfFile = new Document(); | |
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) { | |
Page newPage = pdfFile.getPages().add(); | |
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) { | |
// Define a text input field | |
TextBoxField inputField = new TextBoxField(newPage, | |
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90)); | |
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex); | |
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex); | |
// Attach field to the document form | |
pdfFile.getForm().add(inputField, pageIndex); | |
} | |
} | |
// Save document to disk | |
pdfFile.save("UserForm.pdf"); | |
// Free resources | |
pdfFile.close(); | |
} | |
} |
Цей код демонструє, як витягнути дані з PDF-форми за допомогою Java. Ви можете отримати доступ до різних властивостей форми, таких як альтернативна назва поля, назва відображення, вміст, часткова назва, стан активності, назва стану вибраного поля, індекс сторінки тощо. Для доступу лише до вибраних полів використовуйте індекс поля, наприклад formFields[1].getValue()
для отримання значення першого поля.
У цій статті ми обробили форми у PDF-файлі. Щоб дізнатися, як витягнути шрифти з PDF-файлу, зверніться до статті Витягнення шрифтів з PDF за допомогою Java.