Това кратко ръководство описва процеса за премахване на дублиращи се редове в Excel с Python. Има подробности за настройка на средата за разработка, списък със стъпки за писане на приложението и примерен код за премахване на дублиращи се редове в Excel с Python. Ще бъдат обсъдени различни опции за премахване на дублиращи се редове чрез задаване на различни параметри.
Стъпки за изтриване на дублиращи се редове в Excel с Python
- Настройте IDE да използва Aspose.Cells за Python чрез Java за премахване на дублирани редове
- Заредете Excel файла в обекта Workbook
- Достъп до колекцията клетки от избрания лист
- Извикайте метода removeDuplicates(), за да премахнете всички дублиращи се редове от лист
- Извикайте метода removeDuplicates() с дефиниран диапазон, за да премахнете дублиращите се редове
- Извикайте метода removeDuplicates() с диапазон от клетки и флаг за заглавки и целеви колони
- Запазете резултата
Горните стъпки обясняват процеса за изтриване на дублиращи се записи в Excel с Python. Започнете процеса, като заредите изходния Excel файл в обекта на класа Workbook и извикате различни варианти на метода removeDuplicates(). Запазете изходния Excel файл, след като изтриете желаните повтарящи се редове от изходния файл.
Код за изтриване на повтарящи се редове в Excel с Python
import jpype | |
import asposecells as cells | |
jpype.startJVM() | |
from asposecells.api import License, Workbook | |
# Instantiate a license | |
license = License() | |
license.setLicense("License.lic") | |
book = Workbook("removeduplicates.xlsx") | |
# Remove duplicates from the entire sheet | |
book.getWorksheets().get(1).getCells().removeDuplicates() | |
# Remove duplicate from the defined range | |
book.getWorksheets().get(0).getCells().removeDuplicates(0,7,5,10) | |
# Remove Duplicates based on data from the selected columns | |
cols = [ 0, 3 ] | |
book.getWorksheets().get(0).getCells().removeDuplicates(0, 0, 6, 3,True,cols) | |
# Save result | |
book.save("removeduplicates-result.xlsx") | |
print("Duplicate rows removed successfully") |
Този код обяснява как да изтривате дублиращи се записи в Excel с Python. Методът removeDuplicates() без никакви аргументи ще премахне всички повтарящи се редове от целевия лист, а второто претоварване с начални и крайни клетки дефинира диапазона от клетки, от които искате да изтриете. Друго претоварване отнема диапазон от клетки, флага за показване на наличието на заглавка в данните и накрая списъка с индекси на колони, където искате да сравните данни в дадения диапазон.
Тази статия ни научи как да елиминираме дублиращи се записи в Excel с Python. За да премахнете формули от файла на Excel, вижте статията на как да премахнете формула в Excel с помощта на Python.