Bu makale, Python kullanarak PDF formlarından veri çıkarma hakkında bir rehber sunar. IDE kurulum detayları, adım adım talimatlar ve form alanı verilerine erişmek için örnek bir kod içerir. Örnek kod, alanlar ve değerler içeren bir test PDF’si oluşturacak ve tüm alanlardan verileri çıkaracaktır.
Python Kullanarak PDF Form Alanlarından Veri Çıkarma Adımları
- Aspose.PDF for Python via .NET kullanarak form verilerini çıkarmak için ortamı ayarlayın
- Veri içeren giriş alanlarıyla bir PDF dosyası oluşturun veya Document nesnesine yükleyin
- Yüklenen PDF belgesinin form özelliğinden tüm alanları alın
- Tüm alanları gezerek her bir alana erişin
- Alanın tam adını ve değerini görüntüleyin
Bu adımlar, Python kullanarak doldurulabilir PDF’lerden veri çıkarma işlemini açıklar. Alanlar ve değerler içeren bir PDF dosyası oluşturun veya yükleyin ve PDF dosyasındaki Form özelliğinden alan koleksiyonuna erişin. Tüm alanları gezerek, işleme için alanın tam adını ve değerini alın.
Python Kullanarak PDF’lerden Form Alanlarını Çıkarma Kodu
import aspose.pdf as pdf | |
from aspose.pdf import Document, License, Rectangle | |
from aspose.pdf.forms import TextBoxField | |
def main(): | |
# Load Aspose PDF license | |
license = License() | |
license.set_license("license.lic") | |
# Generate PDF with input fields | |
create_pdf_with_fields() | |
# Open and process the generated PDF file | |
pdf_document = Document("UserForm.pdf") | |
# Retrieve and display form fields | |
form_fields = pdf_document.form.fields | |
for form_field in form_fields: | |
print("Field Name:", form_field.full_name) | |
print("Field Content:", form_field.value) | |
def create_pdf_with_fields(): | |
# Instantiate new PDF document | |
pdf_file = Document() | |
for page_index in range(1, 4): # 3 pages | |
new_page = pdf_file.pages.add() | |
for field_index in range(1, 5): # 4 fields per page | |
# Define a text input field | |
input_field = TextBoxField(new_page, Rectangle(120, field_index * 90, 320,(field_index + 1) * 90,True)) | |
input_field.partial_name = f"inputField_{page_index}_{field_index}" | |
input_field.value = f"Data Entry {page_index}-{field_index}" | |
# Attach field to the document form | |
pdf_file.form.add(input_field, page_index) | |
# Save document to disk | |
pdf_file.save("UserForm.pdf") | |
main() |
Bu kod, PDF formlarından veri çıkarma işlemini gösterir. Document.form.fields koleksiyonunu kullandık, bu koleksiyon PDF’deki tüm alanları içerir. Koleksiyondan erişilen Field nesnesindeki page_index’i kullanarak belirli bir sayfadaki alanları filtreleyebilirsiniz.
Bu makale, PDF form verilerini okuma sürecini öğretti. Eğer bir PDF dosyasını düzleştirmek istiyorsanız, Python’da PDF Nasıl Düzleştirilir makalesine başvurabilirsiniz.