Python-ի միջոցով PDF ձևից տվյալներ հանել

Այս հոդվածը տրամադրում է ուղեցույց, թե ինչպես Python-ի միջոցով PDF ձևից տվյալներ հանել: Այն ներառում է IDE-ի կարգաբերման բոլոր մանրամասները, քայլերի ցանկ և ձևի դաշտերի տվյալներին մուտք գործելու նմուշային կոդ: Նմուշային կոդը կստեղծի փորձարկման PDF ֆայլ, որը պարունակում է դաշտեր և արժեքներ, և կստանա բոլոր դաշտերի տվյալները:

Python-ի միջոցով PDF ձևի դաշտերից տվյալներ հանելու քայլեր

  1. Ձևի տվյալներ հանելու համար Aspose.PDF for Python via .NET-ի օգտագործման համար միջավայրի կարգաբերում
  2. Տվյալներ պարունակող մուտքագրման դաշտերով PDF ֆայլը Document օբյեկտում ստեղծել կամ բեռնել
  3. Բեռնված PDF փաստաթղթի form հատկությունից ստանալ բոլոր դաշտերը
  4. Անցնել բոլոր դաշտերով և մուտք գործել յուրաքանչյուր դաշտ
  5. Ցուցադրել դաշտի ամբողջական անունը և արժեքը

Այս քայլերը նկարագրում են, թե ինչպես Python-ի միջոցով լրացվող PDF-ից տվյալներ հանել: Ստեղծեք կամ բեռնեք PDF ֆայլ, որը պարունակում է դաշտեր և արժեքներ, և մուտք գործեք PDF ֆայլի Form հատկությունից դաշտերի հավաքածուին: Անցեք բոլոր դաշտերով և ստացեք դաշտի ամբողջական անունը և արժեքը հետագա մշակման համար:

Python-ի միջոցով PDF-ից ձևի դաշտեր հանելու կոդ

import aspose.pdf as pdf
from aspose.pdf import Document, License, Rectangle
from aspose.pdf.forms import TextBoxField
def main():
# Load Aspose PDF license
license = License()
license.set_license("license.lic")
# Generate PDF with input fields
create_pdf_with_fields()
# Open and process the generated PDF file
pdf_document = Document("UserForm.pdf")
# Retrieve and display form fields
form_fields = pdf_document.form.fields
for form_field in form_fields:
print("Field Name:", form_field.full_name)
print("Field Content:", form_field.value)
def create_pdf_with_fields():
# Instantiate new PDF document
pdf_file = Document()
for page_index in range(1, 4): # 3 pages
new_page = pdf_file.pages.add()
for field_index in range(1, 5): # 4 fields per page
# Define a text input field
input_field = TextBoxField(new_page, Rectangle(120, field_index * 90, 320,(field_index + 1) * 90,True))
input_field.partial_name = f"inputField_{page_index}_{field_index}"
input_field.value = f"Data Entry {page_index}-{field_index}"
# Attach field to the document form
pdf_file.form.add(input_field, page_index)
# Save document to disk
pdf_file.save("UserForm.pdf")
main()

Այս կոդը ցույց է տալիս, թե ինչպես PDF ձևից տվյալներ հանել: Մենք օգտագործել ենք Document.form.fields հավաքածուն, որը պարունակում է PDF-ի բոլոր դաշտերը: Դուք կարող եք ֆիլտրել որոշակի էջի դաշտերը՝ օգտագործելով page_index-ը Field օբյեկտում, որը ստացվում է հավաքածուից:

Այս հոդվածը մեզ սովորեցրել է PDF ձևի տվյալները կարդալու գործընթացը: Եթե ցանկանում եք հարթեցնել PDF ֆայլը, տեսեք Ինչպես հարթեցնել PDF-ը Python-ում հոդվածը:

 Հայերեն