Ovaj kratki vodič opisuje postupak izdvajanja podataka iz PDF obrasca pomoću Jave. Objašnjava postavke IDE-a, pruža popis koraka za pisanje programa i primjer koda koji demonstrira kako izvesti podatke iz PDF obrasca pomoću Jave. Također pokazuje kako pristupiti svim ili odabranim poljima obrasca i obraditi ih prema potrebi.
Koraci za izdvajanje podataka iz polja PDF obrasca pomoću Jave
- Postavite IDE za korištenje Aspose.PDF za Javu kako biste izdvojili podatke iz obrasca.
- Kreirajte PDF datoteku s tekstualnim poljima i testnim podacima.
- Učitajte PDF datoteku s obrascem i unosnim poljima u objekt Document.
- Pristupite zbirci polja u Form iz učitanog dokumenta.
- Prođite kroz sva polja i dohvatite njihova puna imena i vrijednosti za prikaz na konzoli.
Ovi koraci objašnjavaju kako izdvojiti polja obrasca iz PDF-a pomoću Jave. Možete kreirati PDF datoteku s poljima obrasca i testnim podacima ili učitati postojeću datoteku s obrascem. Pristupite zbirci polja pomoću svojstva Form dokumenta, prođite kroz sva polja i prikažite željene podatke.
Kod za izdvajanje podataka iz ispunjivog PDF obrasca pomoću Jave
import com.aspose.pdf.*; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Load Aspose PDF license | |
License license = new License(); | |
license.setLicense("license.lic"); | |
// Generate PDF with input fields | |
createPdfWithFields(); | |
// Open and process the generated PDF file | |
Document pdfDocument = new Document("UserForm.pdf"); | |
// Retrieve and display form fields | |
Field[] formFields = pdfDocument.getForm().getFields(); | |
for (Field formField : formFields) { | |
System.out.println("Field Name: " + formField.getFullName()); | |
System.out.println("Field Content: " + formField.getValue()); | |
} | |
// Release resources | |
pdfDocument.close(); | |
} | |
private static void createPdfWithFields() { | |
// Instantiate new PDF document | |
Document pdfFile = new Document(); | |
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) { | |
Page newPage = pdfFile.getPages().add(); | |
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) { | |
// Define a text input field | |
TextBoxField inputField = new TextBoxField(newPage, | |
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90)); | |
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex); | |
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex); | |
// Attach field to the document form | |
pdfFile.getForm().add(inputField, pageIndex); | |
} | |
} | |
// Save document to disk | |
pdfFile.save("UserForm.pdf"); | |
// Free resources | |
pdfFile.close(); | |
} | |
} |
Ovaj kod prikazuje kako izdvojiti podatke iz PDF obrasca pomoću Jave. Možete pristupiti raznim svojstvima obrasca, poput alternativnog imena polja, imena mapiranja, sadržaja, djelomičnog imena, aktivnog stanja, naziva označenog stanja, indeksa stranice itd. Ako želite pristupiti samo određenim poljima, koristite indeks polja, npr. formFields[1].getValue()
za dohvaćanje vrijednosti prvog polja.
U ovom članku smo obradili obrasce u PDF datotekama. Za izdvajanje fontova iz PDF datoteke pogledajte članak Izdvajanje fonta iz PDF-a pomoću Jave.