यह त्वरित मार्गदर्शिका पायथन के साथ Excel में डुप्लिकेट पंक्तियों को हटाने की प्रक्रिया का वर्णन करती है। इसमें विकास वातावरण सेट करने के विवरण, एप्लिकेशन लिखने के लिए चरणों की एक सूची और पायथन के साथ एक्सेल में डुप्लिकेट पंक्तियों को हटाने के लिए एक नमूना कोड है। यह विभिन्न मापदंडों को सेट करके डुप्लिकेट पंक्तियों को हटाने के विभिन्न विकल्पों पर चर्चा करेगा।
पायथन के साथ एक्सेल में डुप्लिकेट लाइनों को हटाने के चरण
- डुप्लिकेट पंक्तियों को हटाने के लिए IDE को जावा के माध्यम से पायथन के लिए Aspose.Cells का उपयोग करने के लिए सेट करें
- एक्सेल फ़ाइल को Workbook ऑब्जेक्ट में लोड करें
- चयनित शीट से सेल संग्रह तक पहुंचें
- किसी शीट से सभी डुप्लिकेट पंक्तियों को हटाने के लिए removeDuplicates() विधि को कॉल करें
- डुप्लिकेट लाइनों को हटाने के लिए निर्धारित सीमा के साथ removeDuplicates() विधि को कॉल करें
- शीर्षलेखों और लक्ष्य स्तंभों के लिए कक्षों की श्रेणी और ध्वज के साथ removeDuplicates() विधि को कॉल करें
- आउटपुट सहेजें
उपरोक्त चरण पायथन के साथ एक्सेल में डुप्लिकेट प्रविष्टियों को हटाने की प्रक्रिया को समझाते हैं। स्रोत एक्सेल फ़ाइल को वर्कबुक क्लास ऑब्जेक्ट में लोड करके और removeDuplicates() विधि के विभिन्न प्रकारों को कॉल करके प्रक्रिया शुरू करें। स्रोत फ़ाइल से वांछित दोहराई गई पंक्तियों को हटाने के बाद आउटपुट एक्सेल फ़ाइल को सहेजें।
पायथन के साथ एक्सेल में दोहराई गई पंक्तियों को हटाने के लिए कोड
import jpype | |
import asposecells as cells | |
jpype.startJVM() | |
from asposecells.api import License, Workbook | |
# Instantiate a license | |
license = License() | |
license.setLicense("License.lic") | |
book = Workbook("removeduplicates.xlsx") | |
# Remove duplicates from the entire sheet | |
book.getWorksheets().get(1).getCells().removeDuplicates() | |
# Remove duplicate from the defined range | |
book.getWorksheets().get(0).getCells().removeDuplicates(0,7,5,10) | |
# Remove Duplicates based on data from the selected columns | |
cols = [ 0, 3 ] | |
book.getWorksheets().get(0).getCells().removeDuplicates(0, 0, 6, 3,True,cols) | |
# Save result | |
book.save("removeduplicates-result.xlsx") | |
print("Duplicate rows removed successfully") |
यह कोड बताता है कि पायथन के साथ एक्सेल में डुप्लिकेट रिकॉर्ड कैसे डिलीट करें। removeDuplicates() विधि बिना किसी तर्क के लक्ष्य शीट से सभी दोहराई गई पंक्तियों को हटा देगी, और आरंभिक और अंतिम कोशिकाओं के साथ दूसरा ओवरलोड उन कोशिकाओं की सीमा को परिभाषित करता है जिनसे आप हटाना चाहते हैं। एक और ओवरलोड कोशिकाओं की एक सीमा लेता है, डेटा में हेडर की उपस्थिति दिखाने के लिए ध्वज, और अंत में, कॉलम इंडेक्स की सूची जहां आप दी गई सीमा के भीतर डेटा की तुलना करना चाहते हैं।
इस लेख में हमने बताया है कि पायथन की मदद से एक्सेल में डुप्लिकेट प्रविष्टियों को कैसे हटाया जाए। एक्सेल फ़ाइल से फ़ॉर्मूले हटाने के लिए, पायथन का उपयोग करके एक्सेल में सूत्र कैसे निकालें पर लेख देखें।