Python का उपयोग करके PDF फॉर्म से डेटा निकालें

यह लेख Python का उपयोग करके PDF फॉर्म से डेटा निकालने के बारे में एक गाइड प्रदान करता है। इसमें IDE सेट करने के सभी विवरण, चरणों की सूची और फॉर्म फ़ील्ड डेटा तक पहुंचने के लिए एक नमूना कोड शामिल है। नमूना कोड एक टेस्ट PDF बनाएगा जिसमें फ़ील्ड और मान होंगे, और सभी फ़ील्ड से डेटा प्राप्त करेगा।

Python का उपयोग करके PDF फॉर्म फ़ील्ड से डेटा निकालने के चरण

  1. फॉर्म डेटा निकालने के लिए Aspose.PDF for Python via .NET का उपयोग करने के लिए पर्यावरण स्थापित करें
  2. डेटा युक्त इनपुट फ़ील्ड के साथ एक PDF फ़ाइल को Document ऑब्जेक्ट में बनाएं या लोड करें
  3. लोड किए गए PDF दस्तावेज़ के form प्रॉपर्टी से सभी फ़ील्ड प्राप्त करें
  4. सभी फ़ील्ड के माध्यम से पार्स करें और प्रत्येक फ़ील्ड तक पहुंचें
  5. फ़ील्ड का पूरा नाम और मान प्रदर्शित करें

ये चरण बताते हैं कि Python का उपयोग करके भरने योग्य PDF से डेटा कैसे निकालें। फ़ील्ड और मान के साथ एक PDF फ़ाइल बनाएं या लोड करें, और PDF फ़ाइल में Form प्रॉपर्टी से फ़ील्ड के संग्रह तक पहुंचें। सभी फ़ील्ड के माध्यम से पार्स करें और प्रसंस्करण के लिए पूरा नाम और मान प्राप्त करें।

Python का उपयोग करके PDF से फॉर्म फ़ील्ड निकालने के लिए कोड

import aspose.pdf as pdf
from aspose.pdf import Document, License, Rectangle
from aspose.pdf.forms import TextBoxField
def main():
# Load Aspose PDF license
license = License()
license.set_license("license.lic")
# Generate PDF with input fields
create_pdf_with_fields()
# Open and process the generated PDF file
pdf_document = Document("UserForm.pdf")
# Retrieve and display form fields
form_fields = pdf_document.form.fields
for form_field in form_fields:
print("Field Name:", form_field.full_name)
print("Field Content:", form_field.value)
def create_pdf_with_fields():
# Instantiate new PDF document
pdf_file = Document()
for page_index in range(1, 4): # 3 pages
new_page = pdf_file.pages.add()
for field_index in range(1, 5): # 4 fields per page
# Define a text input field
input_field = TextBoxField(new_page, Rectangle(120, field_index * 90, 320,(field_index + 1) * 90,True))
input_field.partial_name = f"inputField_{page_index}_{field_index}"
input_field.value = f"Data Entry {page_index}-{field_index}"
# Attach field to the document form
pdf_file.form.add(input_field, page_index)
# Save document to disk
pdf_file.save("UserForm.pdf")
main()

इस कोड ने दिखाया है कि PDF फॉर्म से डेटा कैसे निकालें। हमने Document.form.fields संग्रह का उपयोग किया है, जिसमें PDF में सभी फ़ील्ड होते हैं। आप संग्रह से एक्सेस किए गए Field ऑब्जेक्ट में page_index का उपयोग करके किसी विशेष पृष्ठ के फ़ील्ड को फ़िल्टर कर सकते हैं।

इस लेख ने हमें PDF फॉर्म डेटा पढ़ने की प्रक्रिया सिखाई है। यदि आप एक PDF फ़ाइल को समतल करना चाहते हैं, तो Python में PDF को समतल कैसे करें लेख देखें।

 हिन्दी