Den här snabbguiden beskriver processen för att ta bort dubbletter av rader i Excel med Python. Den har detaljerna för att ställa in utvecklingsmiljön, en lista med steg för att skriva applikationen och en exempelkod för att eliminera dubbletter av rader i Excel med Python. Den kommer att diskutera olika alternativ för att ta bort dubbletter av rader genom att ställa in olika parametrar.
Steg för att ta bort dubbletter av linjer i Excel med Python
- Ställ in IDE att använda Aspose.Cells för Python via Java för att ta bort dubbletter av rader
- Ladda Excel-filen i objektet Workbook
- Öppna cellsamlingen från det valda arket
- Anropa metoden removeDuplicates() för att ta bort alla dubbletter av rader från ett arbetsblad
- Anropa metoden removeDuplicates() med ett definierat intervall för att eliminera dubbletter av rader
- Anropa metoden removeDuplicates() med ett cellintervall och flagga för rubriker och målkolumner
- Spara utgången
Ovanstående steg förklarar processen för att ta bort dubbletter i Excel med Python. Börja processen genom att ladda källfilen i Excel i Workbook-klassobjektet och anropa olika varianter av metoden removeDuplicates(). Spara den utgående Excel-filen efter att du har raderat de önskade upprepade raderna från källfilen.
Kod för att ta bort upprepade rader i Excel med Python
Den här koden förklarar hur man tar bort dubblettposter i Excel med Python. Metoden removeDuplicates() utan några argument tar bort alla upprepade rader från målarket, och den andra överbelastningen med start- och slutceller definierar intervallet för de celler som du vill ta bort. En annan överbelastning tar ett antal celler, flaggan för att visa närvaron av en rubrik i data, och slutligen listan över kolumnindex där du vill jämföra data inom det givna området.
Den här artikeln har lärt oss hur man eliminerar dubbla poster i Excel med Python. För att ta bort formler från Excel-filen, se artikeln om hur man tar bort formel i Excel med Python.