इस त्वरित ट्यूटोरियल में **पायथन में वर्ड दस्तावेज़ से सभी छवियों को निकालने के तरीके ** के बारे में जानकारी है। यह पर्यावरण को कॉन्फ़िगर करने के लिए सभी संसाधन प्रदान करता है और महत्वपूर्ण एपीआई निर्माणों का परिचय देता है जो वर्ग के नाम, विधियों और गुणों सहित कार्य को पूरा करने के लिए आवश्यक हैं। आप चरणों का पालन कर सकते हैं और पायथन में वर्ड दस्तावेज़ से चित्र निकालने के लिए एक पूरा प्रोग्राम लिख सकते हैं जैसे DOCX फ़ाइल से चित्र निकालना और इसे एक छवि प्रकार PNG, JPG, आदि के रूप में सहेजना। डिस्क पर।
पायथन में वर्ड फाइल से इमेज निकालने के चरण
- छवियों को निकालने के लिए Aspose.Words for Python by .NET का उपयोग करने के लिए परिवेश को कॉन्फ़िगर करें
- स्रोत वर्ड फ़ाइल को Document क्लास ऑब्जेक्ट का उपयोग करके छवियों के साथ लोड करें
- get_child_nodes() पद्धति का उपयोग करके लोड किए गए दस्तावेज़ से सभी आकृतियों की सूची प्राप्त करें
- आकार संग्रह में सभी तत्वों के माध्यम से पार्स करें और छवियों का पता लगाएं
- आकृति संग्रह में प्रत्येक खोजी गई छवि के लिए अद्वितीय फ़ाइल नाम बनाएं
- डिस्क पर निकाली गई छवि को अद्वितीय नाम से सहेजें
ये चरण पर्यावरण कॉन्फ़िगरेशन और प्रोग्राम लिखने के चरणों को साझा करके **पायथन में वर्ड दस्तावेज़ से चित्र निकालने की प्रक्रिया का वर्णन करते हैं। परिवेश स्थापित करने के बाद, Word फ़ाइल को दस्तावेज़ वर्ग ऑब्जेक्ट का उपयोग करके छवियों के साथ लोड करें और इससे सभी आकृतियों का संग्रह प्राप्त करें। जैसा कि शेप क्लास में छवियों का पता लगाने के तरीके हैं, आप छवियों को निकाल सकते हैं और उन्हें निर्दिष्ट नाम के साथ डिस्क पर सहेज सकते हैं।
पायथन में वर्ड दस्तावेज़ से तस्वीरें निकालने के लिए कोड
import aspose.words as aw | |
# Load the license | |
wordProtected = aw.License() | |
wordProtected.set_license("Aspose.Total.lic") | |
# Load a document | |
wordDocument = aw.Document("WordFileWithImages.docx") | |
# Get shapes collection | |
allShapes = wordDocument.get_child_nodes(aw.NodeType.SHAPE, True) | |
# Declare counter for images | |
index = 0 | |
# Iterate through all the shapes to detect and save images | |
for shape in allShapes: | |
# Type cast the node object to shape | |
shape = shape.as_shape() | |
if(shape.has_image): | |
index = index + 1 | |
# Prepare file name using the image counter and image type in the shape object | |
image_file_name = f"File.extract_images.{index}{aw.FileFormatUtil.image_type_to_extension(shape.image_data.image_type)}" | |
# Save the extracted image on the disk | |
shape.image_data.save(image_file_name) | |
print ("Images extracted successfully from the Word file") |
यहां कोड प्रस्तुत किया गया है जो दस्तावेज़ वर्ग ऑब्जेक्ट का उपयोग करके स्रोत फ़ाइल को लोड करके * पायथन में वर्ड से चित्र निकालने की प्रक्रिया को प्रदर्शित करता है जिसमें संरक्षित फ़ाइलों के लिए पासवर्ड प्रदान करने, एन्कोडिंग सेट करने और चेतावनी संलग्न करने जैसी बहुत सारी विशेषताएं हैं। लोडिंग प्रक्रिया को नियंत्रित करने के लिए कॉलबैक। इसी तरह, get_child_nodes() विधि का उपयोग आकृतियों को निकालने के लिए किया जाता है, हालांकि, आप अन्य नोड्स जैसे हेडर, फ़ुटर, टेबल, कमेंट, फ़ुटनोट और बॉडी आदि भी प्राप्त कर सकते हैं।
इस लेख ने हमें पायथन में एक वर्ड फ़ाइल से सभी तस्वीरें लाने के लिए निर्देशित किया है। यदि आप किसी वर्ड फाइल में फोटो डालने की प्रक्रिया सीखना चाहते हैं, तो पायथन का उपयोग करके वर्ड में चित्र कैसे डालें पर लेख देखें।