पायथन में वर्ड डॉक्यूमेंट से सभी इमेज कैसे निकालें

इस त्वरित ट्यूटोरियल में **पायथन में वर्ड दस्तावेज़ से सभी छवियों को निकालने के तरीके ** के बारे में जानकारी है। यह पर्यावरण को कॉन्फ़िगर करने के लिए सभी संसाधन प्रदान करता है और महत्वपूर्ण एपीआई निर्माणों का परिचय देता है जो वर्ग के नाम, विधियों और गुणों सहित कार्य को पूरा करने के लिए आवश्यक हैं। आप चरणों का पालन कर सकते हैं और पायथन में वर्ड दस्तावेज़ से चित्र निकालने के लिए एक पूरा प्रोग्राम लिख सकते हैं जैसे DOCX फ़ाइल से चित्र निकालना और इसे एक छवि प्रकार PNG, JPG, आदि के रूप में सहेजना। डिस्क पर।

पायथन में वर्ड फाइल से इमेज निकालने के चरण

  1. छवियों को निकालने के लिए Aspose.Words for Python by .NET का उपयोग करने के लिए परिवेश को कॉन्फ़िगर करें
  2. स्रोत वर्ड फ़ाइल को Document क्लास ऑब्जेक्ट का उपयोग करके छवियों के साथ लोड करें
  3. get_child_nodes() पद्धति का उपयोग करके लोड किए गए दस्तावेज़ से सभी आकृतियों की सूची प्राप्त करें
  4. आकार संग्रह में सभी तत्वों के माध्यम से पार्स करें और छवियों का पता लगाएं
  5. आकृति संग्रह में प्रत्येक खोजी गई छवि के लिए अद्वितीय फ़ाइल नाम बनाएं
  6. डिस्क पर निकाली गई छवि को अद्वितीय नाम से सहेजें

ये चरण पर्यावरण कॉन्फ़िगरेशन और प्रोग्राम लिखने के चरणों को साझा करके **पायथन में वर्ड दस्तावेज़ से चित्र निकालने की प्रक्रिया का वर्णन करते हैं। परिवेश स्थापित करने के बाद, Word फ़ाइल को दस्तावेज़ वर्ग ऑब्जेक्ट का उपयोग करके छवियों के साथ लोड करें और इससे सभी आकृतियों का संग्रह प्राप्त करें। जैसा कि शेप क्लास में छवियों का पता लगाने के तरीके हैं, आप छवियों को निकाल सकते हैं और उन्हें निर्दिष्ट नाम के साथ डिस्क पर सहेज सकते हैं।

पायथन में वर्ड दस्तावेज़ से तस्वीरें निकालने के लिए कोड

import aspose.words as aw
# Load the license
wordProtected = aw.License()
wordProtected.set_license("Aspose.Total.lic")
# Load a document
wordDocument = aw.Document("WordFileWithImages.docx")
# Get shapes collection
allShapes = wordDocument.get_child_nodes(aw.NodeType.SHAPE, True)
# Declare counter for images
index = 0
# Iterate through all the shapes to detect and save images
for shape in allShapes:
# Type cast the node object to shape
shape = shape.as_shape()
if(shape.has_image):
index = index + 1
# Prepare file name using the image counter and image type in the shape object
image_file_name = f"File.extract_images.{index}{aw.FileFormatUtil.image_type_to_extension(shape.image_data.image_type)}"
# Save the extracted image on the disk
shape.image_data.save(image_file_name)
print ("Images extracted successfully from the Word file")

यहां कोड प्रस्तुत किया गया है जो दस्तावेज़ वर्ग ऑब्जेक्ट का उपयोग करके स्रोत फ़ाइल को लोड करके * पायथन में वर्ड से चित्र निकालने की प्रक्रिया को प्रदर्शित करता है जिसमें संरक्षित फ़ाइलों के लिए पासवर्ड प्रदान करने, एन्कोडिंग सेट करने और चेतावनी संलग्न करने जैसी बहुत सारी विशेषताएं हैं। लोडिंग प्रक्रिया को नियंत्रित करने के लिए कॉलबैक। इसी तरह, get_child_nodes() विधि का उपयोग आकृतियों को निकालने के लिए किया जाता है, हालांकि, आप अन्य नोड्स जैसे हेडर, फ़ुटर, टेबल, कमेंट, फ़ुटनोट और बॉडी आदि भी प्राप्त कर सकते हैं।

इस लेख ने हमें पायथन में एक वर्ड फ़ाइल से सभी तस्वीरें लाने के लिए निर्देशित किया है। यदि आप किसी वर्ड फाइल में फोटो डालने की प्रक्रिया सीखना चाहते हैं, तो पायथन का उपयोग करके वर्ड में चित्र कैसे डालें पर लेख देखें।

 हिन्दी