यह लेख Python का उपयोग करके PDF फॉर्म से डेटा निकालने के बारे में एक गाइड प्रदान करता है। इसमें IDE सेट करने के सभी विवरण, चरणों की सूची और फॉर्म फ़ील्ड डेटा तक पहुंचने के लिए एक नमूना कोड शामिल है। नमूना कोड एक टेस्ट PDF बनाएगा जिसमें फ़ील्ड और मान होंगे, और सभी फ़ील्ड से डेटा प्राप्त करेगा।
Python का उपयोग करके PDF फॉर्म फ़ील्ड से डेटा निकालने के चरण
- फॉर्म डेटा निकालने के लिए Aspose.PDF for Python via .NET का उपयोग करने के लिए पर्यावरण स्थापित करें
- डेटा युक्त इनपुट फ़ील्ड के साथ एक PDF फ़ाइल को Document ऑब्जेक्ट में बनाएं या लोड करें
- लोड किए गए PDF दस्तावेज़ के form प्रॉपर्टी से सभी फ़ील्ड प्राप्त करें
- सभी फ़ील्ड के माध्यम से पार्स करें और प्रत्येक फ़ील्ड तक पहुंचें
- फ़ील्ड का पूरा नाम और मान प्रदर्शित करें
ये चरण बताते हैं कि Python का उपयोग करके भरने योग्य PDF से डेटा कैसे निकालें। फ़ील्ड और मान के साथ एक PDF फ़ाइल बनाएं या लोड करें, और PDF फ़ाइल में Form प्रॉपर्टी से फ़ील्ड के संग्रह तक पहुंचें। सभी फ़ील्ड के माध्यम से पार्स करें और प्रसंस्करण के लिए पूरा नाम और मान प्राप्त करें।
Python का उपयोग करके PDF से फॉर्म फ़ील्ड निकालने के लिए कोड
import aspose.pdf as pdf | |
from aspose.pdf import Document, License, Rectangle | |
from aspose.pdf.forms import TextBoxField | |
def main(): | |
# Load Aspose PDF license | |
license = License() | |
license.set_license("license.lic") | |
# Generate PDF with input fields | |
create_pdf_with_fields() | |
# Open and process the generated PDF file | |
pdf_document = Document("UserForm.pdf") | |
# Retrieve and display form fields | |
form_fields = pdf_document.form.fields | |
for form_field in form_fields: | |
print("Field Name:", form_field.full_name) | |
print("Field Content:", form_field.value) | |
def create_pdf_with_fields(): | |
# Instantiate new PDF document | |
pdf_file = Document() | |
for page_index in range(1, 4): # 3 pages | |
new_page = pdf_file.pages.add() | |
for field_index in range(1, 5): # 4 fields per page | |
# Define a text input field | |
input_field = TextBoxField(new_page, Rectangle(120, field_index * 90, 320,(field_index + 1) * 90,True)) | |
input_field.partial_name = f"inputField_{page_index}_{field_index}" | |
input_field.value = f"Data Entry {page_index}-{field_index}" | |
# Attach field to the document form | |
pdf_file.form.add(input_field, page_index) | |
# Save document to disk | |
pdf_file.save("UserForm.pdf") | |
main() |
इस कोड ने दिखाया है कि PDF फॉर्म से डेटा कैसे निकालें। हमने Document.form.fields संग्रह का उपयोग किया है, जिसमें PDF में सभी फ़ील्ड होते हैं। आप संग्रह से एक्सेस किए गए Field ऑब्जेक्ट में page_index का उपयोग करके किसी विशेष पृष्ठ के फ़ील्ड को फ़िल्टर कर सकते हैं।
इस लेख ने हमें PDF फॉर्म डेटा पढ़ने की प्रक्रिया सिखाई है। यदि आप एक PDF फ़ाइल को समतल करना चाहते हैं, तो Python में PDF को समतल कैसे करें लेख देखें।