Ten krótki samouczek opisuje proces wyodrębniania danych z formularza PDF przy użyciu Java. Zawiera on szczegóły dotyczące konfiguracji IDE, listę kroków do napisania programu oraz przykładowy kod pokazujący, jak eksportować dane z formularza PDF przy użyciu Java. Szczegóły dotyczące dostępu do wszystkich lub wybranych pól w formularzu i przetwarzania ich zgodnie z potrzebami są również przedstawione.
Kroki wyodrębniania danych z pól formularza PDF przy użyciu Java
- Skonfiguruj IDE do używania Aspose.PDF for Java w celu wyodrębnienia danych formularza
- Utwórz plik PDF z polami tekstowymi i przykładowymi danymi
- Załaduj plik PDF z formularzem i polami wejściowymi do obiektu Document
- Uzyskaj dostęp do kolekcji pól w formularzu z załadowanego dokumentu
- Przejrzyj wszystkie pola i uzyskaj pełną nazwę oraz wartość do wyświetlenia na konsoli
Te kroki wyjaśniają, jak wyodrębnić pola formularza z PDF przy użyciu Java. Utwórz plik PDF z polami formularza i przykładowymi danymi lub załaduj istniejący plik z danymi formularza. Uzyskaj dostęp do kolekcji pól z właściwości Form dokumentu, przejrzyj wszystkie pola i wyświetl żądane właściwości.
Przykładowy kod do wyodrębniania danych z wypełnialnego formularza PDF przy użyciu Java
import com.aspose.pdf.*; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Load Aspose PDF license | |
License license = new License(); | |
license.setLicense("license.lic"); | |
// Generate PDF with input fields | |
createPdfWithFields(); | |
// Open and process the generated PDF file | |
Document pdfDocument = new Document("UserForm.pdf"); | |
// Retrieve and display form fields | |
Field[] formFields = pdfDocument.getForm().getFields(); | |
for (Field formField : formFields) { | |
System.out.println("Field Name: " + formField.getFullName()); | |
System.out.println("Field Content: " + formField.getValue()); | |
} | |
// Release resources | |
pdfDocument.close(); | |
} | |
private static void createPdfWithFields() { | |
// Instantiate new PDF document | |
Document pdfFile = new Document(); | |
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) { | |
Page newPage = pdfFile.getPages().add(); | |
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) { | |
// Define a text input field | |
TextBoxField inputField = new TextBoxField(newPage, | |
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90)); | |
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex); | |
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex); | |
// Attach field to the document form | |
pdfFile.getForm().add(inputField, pageIndex); | |
} | |
} | |
// Save document to disk | |
pdfFile.save("UserForm.pdf"); | |
// Free resources | |
pdfFile.close(); | |
} | |
} |
Ten kod demonstruje, jak wyodrębnić dane z formularza PDF przy użyciu Java. Możesz uzyskać dostęp do różnych właściwości formularza, takich jak alternatywna nazwa pola, nazwa mapowania, zawartość, częściowa nazwa, stan aktywny, nazwa stanu zaznaczenia, indeks strony itp. Aby uzyskać dostęp tylko do wybranych pól, użyj indeksu pola, np. formFields[1].getValue()
, aby uzyskać wartość pierwszego pola.
W tym artykule przetworzyliśmy formularze w pliku PDF. Aby wyodrębnić czcionki z pliku PDF, zapoznaj się z artykułem Wyodrębnianie czcionek z PDF przy użyciu Java.