Den här snabbguiden beskriver processen för att ta bort dubbletter av rader i Excel med Python. Den har detaljerna för att ställa in utvecklingsmiljön, en lista med steg för att skriva applikationen och en exempelkod för att eliminera dubbletter av rader i Excel med Python. Den kommer att diskutera olika alternativ för att ta bort dubbletter av rader genom att ställa in olika parametrar.
Steg för att ta bort dubbletter av linjer i Excel med Python
- Ställ in IDE att använda Aspose.Cells för Python via Java för att ta bort dubbletter av rader
- Ladda Excel-filen i objektet Workbook
- Öppna cellsamlingen från det valda arket
- Anropa metoden removeDuplicates() för att ta bort alla dubbletter av rader från ett arbetsblad
- Anropa metoden removeDuplicates() med ett definierat intervall för att eliminera dubbletter av rader
- Anropa metoden removeDuplicates() med ett cellintervall och flagga för rubriker och målkolumner
- Spara utgången
Ovanstående steg förklarar processen för att ta bort dubbletter i Excel med Python. Börja processen genom att ladda källfilen i Excel i Workbook-klassobjektet och anropa olika varianter av metoden removeDuplicates(). Spara den utgående Excel-filen efter att du har raderat de önskade upprepade raderna från källfilen.
Kod för att ta bort upprepade rader i Excel med Python
import jpype | |
import asposecells as cells | |
jpype.startJVM() | |
from asposecells.api import License, Workbook | |
# Instantiate a license | |
license = License() | |
license.setLicense("License.lic") | |
book = Workbook("removeduplicates.xlsx") | |
# Remove duplicates from the entire sheet | |
book.getWorksheets().get(1).getCells().removeDuplicates() | |
# Remove duplicate from the defined range | |
book.getWorksheets().get(0).getCells().removeDuplicates(0,7,5,10) | |
# Remove Duplicates based on data from the selected columns | |
cols = [ 0, 3 ] | |
book.getWorksheets().get(0).getCells().removeDuplicates(0, 0, 6, 3,True,cols) | |
# Save result | |
book.save("removeduplicates-result.xlsx") | |
print("Duplicate rows removed successfully") |
Den här koden förklarar hur man tar bort dubblettposter i Excel med Python. Metoden removeDuplicates() utan några argument tar bort alla upprepade rader från målarket, och den andra överbelastningen med start- och slutceller definierar intervallet för de celler som du vill ta bort. En annan överbelastning tar ett antal celler, flaggan för att visa närvaron av en rubrik i data, och slutligen listan över kolumnindex där du vill jämföra data inom det givna området.
Den här artikeln har lärt oss hur man eliminerar dubbla poster i Excel med Python. För att ta bort formler från Excel-filen, se artikeln om hur man tar bort formel i Excel med Python.