Python Kullanarak PDF Formlarından Veri Çıkarma

Bu makale, Python kullanarak PDF formlarından veri çıkarma hakkında bir rehber sunar. IDE kurulum detayları, adım adım talimatlar ve form alanı verilerine erişmek için örnek bir kod içerir. Örnek kod, alanlar ve değerler içeren bir test PDF’si oluşturacak ve tüm alanlardan verileri çıkaracaktır.

Python Kullanarak PDF Form Alanlarından Veri Çıkarma Adımları

  1. Aspose.PDF for Python via .NET kullanarak form verilerini çıkarmak için ortamı ayarlayın
  2. Veri içeren giriş alanlarıyla bir PDF dosyası oluşturun veya Document nesnesine yükleyin
  3. Yüklenen PDF belgesinin form özelliğinden tüm alanları alın
  4. Tüm alanları gezerek her bir alana erişin
  5. Alanın tam adını ve değerini görüntüleyin

Bu adımlar, Python kullanarak doldurulabilir PDF’lerden veri çıkarma işlemini açıklar. Alanlar ve değerler içeren bir PDF dosyası oluşturun veya yükleyin ve PDF dosyasındaki Form özelliğinden alan koleksiyonuna erişin. Tüm alanları gezerek, işleme için alanın tam adını ve değerini alın.

Python Kullanarak PDF’lerden Form Alanlarını Çıkarma Kodu

import aspose.pdf as pdf
from aspose.pdf import Document, License, Rectangle
from aspose.pdf.forms import TextBoxField
def main():
# Load Aspose PDF license
license = License()
license.set_license("license.lic")
# Generate PDF with input fields
create_pdf_with_fields()
# Open and process the generated PDF file
pdf_document = Document("UserForm.pdf")
# Retrieve and display form fields
form_fields = pdf_document.form.fields
for form_field in form_fields:
print("Field Name:", form_field.full_name)
print("Field Content:", form_field.value)
def create_pdf_with_fields():
# Instantiate new PDF document
pdf_file = Document()
for page_index in range(1, 4): # 3 pages
new_page = pdf_file.pages.add()
for field_index in range(1, 5): # 4 fields per page
# Define a text input field
input_field = TextBoxField(new_page, Rectangle(120, field_index * 90, 320,(field_index + 1) * 90,True))
input_field.partial_name = f"inputField_{page_index}_{field_index}"
input_field.value = f"Data Entry {page_index}-{field_index}"
# Attach field to the document form
pdf_file.form.add(input_field, page_index)
# Save document to disk
pdf_file.save("UserForm.pdf")
main()

Bu kod, PDF formlarından veri çıkarma işlemini gösterir. Document.form.fields koleksiyonunu kullandık, bu koleksiyon PDF’deki tüm alanları içerir. Koleksiyondan erişilen Field nesnesindeki page_index’i kullanarak belirli bir sayfadaki alanları filtreleyebilirsiniz.

Bu makale, PDF form verilerini okuma sürecini öğretti. Eğer bir PDF dosyasını düzleştirmek istiyorsanız, Python’da PDF Nasıl Düzleştirilir makalesine başvurabilirsiniz.

 Türkçe