पायथन के साथ एक्सेल में डुप्लिकेट पंक्तियाँ हटाएँ

यह त्वरित मार्गदर्शिका पायथन के साथ Excel में डुप्लिकेट पंक्तियों को हटाने की प्रक्रिया का वर्णन करती है। इसमें विकास वातावरण सेट करने के विवरण, एप्लिकेशन लिखने के लिए चरणों की एक सूची और पायथन के साथ एक्सेल में डुप्लिकेट पंक्तियों को हटाने के लिए एक नमूना कोड है। यह विभिन्न मापदंडों को सेट करके डुप्लिकेट पंक्तियों को हटाने के विभिन्न विकल्पों पर चर्चा करेगा।

पायथन के साथ एक्सेल में डुप्लिकेट लाइनों को हटाने के चरण

  1. डुप्लिकेट पंक्तियों को हटाने के लिए IDE को जावा के माध्यम से पायथन के लिए Aspose.Cells का उपयोग करने के लिए सेट करें
  2. एक्सेल फ़ाइल को Workbook ऑब्जेक्ट में लोड करें
  3. चयनित शीट से सेल संग्रह तक पहुंचें
  4. किसी शीट से सभी डुप्लिकेट पंक्तियों को हटाने के लिए removeDuplicates() विधि को कॉल करें
  5. डुप्लिकेट लाइनों को हटाने के लिए निर्धारित सीमा के साथ removeDuplicates() विधि को कॉल करें
  6. शीर्षलेखों और लक्ष्य स्तंभों के लिए कक्षों की श्रेणी और ध्वज के साथ removeDuplicates() विधि को कॉल करें
  7. आउटपुट सहेजें

उपरोक्त चरण पायथन के साथ एक्सेल में डुप्लिकेट प्रविष्टियों को हटाने की प्रक्रिया को समझाते हैं। स्रोत एक्सेल फ़ाइल को वर्कबुक क्लास ऑब्जेक्ट में लोड करके और removeDuplicates() विधि के विभिन्न प्रकारों को कॉल करके प्रक्रिया शुरू करें। स्रोत फ़ाइल से वांछित दोहराई गई पंक्तियों को हटाने के बाद आउटपुट एक्सेल फ़ाइल को सहेजें।

पायथन के साथ एक्सेल में दोहराई गई पंक्तियों को हटाने के लिए कोड

import jpype
import asposecells as cells
jpype.startJVM()
from asposecells.api import License, Workbook
# Instantiate a license
license = License()
license.setLicense("License.lic")
book = Workbook("removeduplicates.xlsx")
# Remove duplicates from the entire sheet
book.getWorksheets().get(1).getCells().removeDuplicates()
# Remove duplicate from the defined range
book.getWorksheets().get(0).getCells().removeDuplicates(0,7,5,10)
# Remove Duplicates based on data from the selected columns
cols = [ 0, 3 ]
book.getWorksheets().get(0).getCells().removeDuplicates(0, 0, 6, 3,True,cols)
# Save result
book.save("removeduplicates-result.xlsx")
print("Duplicate rows removed successfully")

यह कोड बताता है कि पायथन के साथ एक्सेल में डुप्लिकेट रिकॉर्ड कैसे डिलीट करें। removeDuplicates() विधि बिना किसी तर्क के लक्ष्य शीट से सभी दोहराई गई पंक्तियों को हटा देगी, और आरंभिक और अंतिम कोशिकाओं के साथ दूसरा ओवरलोड उन कोशिकाओं की सीमा को परिभाषित करता है जिनसे आप हटाना चाहते हैं। एक और ओवरलोड कोशिकाओं की एक सीमा लेता है, डेटा में हेडर की उपस्थिति दिखाने के लिए ध्वज, और अंत में, कॉलम इंडेक्स की सूची जहां आप दी गई सीमा के भीतर डेटा की तुलना करना चाहते हैं।

इस लेख में हमने बताया है कि पायथन की मदद से एक्सेल में डुप्लिकेट प्रविष्टियों को कैसे हटाया जाए। एक्सेल फ़ाइल से फ़ॉर्मूले हटाने के लिए, पायथन का उपयोग करके एक्सेल में सूत्र कैसे निकालें पर लेख देखें।

 हिन्दी