Премахване на дублиращи се редове в Excel с Python

Това кратко ръководство описва процеса за премахване на дублиращи се редове в Excel с Python. Има подробности за настройка на средата за разработка, списък със стъпки за писане на приложението и примерен код за премахване на дублиращи се редове в Excel с Python. Ще бъдат обсъдени различни опции за премахване на дублиращи се редове чрез задаване на различни параметри.

Стъпки за изтриване на дублиращи се редове в Excel с Python

  1. Настройте IDE да използва Aspose.Cells за Python чрез Java за премахване на дублирани редове
  2. Заредете Excel файла в обекта Workbook
  3. Достъп до колекцията клетки от избрания лист
  4. Извикайте метода removeDuplicates(), за да премахнете всички дублиращи се редове от лист
  5. Извикайте метода removeDuplicates() с дефиниран диапазон, за да премахнете дублиращите се редове
  6. Извикайте метода removeDuplicates() с диапазон от клетки и флаг за заглавки и целеви колони
  7. Запазете резултата

Горните стъпки обясняват процеса за изтриване на дублиращи се записи в Excel с Python. Започнете процеса, като заредите изходния Excel файл в обекта на класа Workbook и извикате различни варианти на метода removeDuplicates(). Запазете изходния Excel файл, след като изтриете желаните повтарящи се редове от изходния файл.

Код за изтриване на повтарящи се редове в Excel с Python

import jpype
import asposecells as cells
jpype.startJVM()
from asposecells.api import License, Workbook
# Instantiate a license
license = License()
license.setLicense("License.lic")
book = Workbook("removeduplicates.xlsx")
# Remove duplicates from the entire sheet
book.getWorksheets().get(1).getCells().removeDuplicates()
# Remove duplicate from the defined range
book.getWorksheets().get(0).getCells().removeDuplicates(0,7,5,10)
# Remove Duplicates based on data from the selected columns
cols = [ 0, 3 ]
book.getWorksheets().get(0).getCells().removeDuplicates(0, 0, 6, 3,True,cols)
# Save result
book.save("removeduplicates-result.xlsx")
print("Duplicate rows removed successfully")

Този код обяснява как да изтривате дублиращи се записи в Excel с Python. Методът removeDuplicates() без никакви аргументи ще премахне всички повтарящи се редове от целевия лист, а второто претоварване с начални и крайни клетки дефинира диапазона от клетки, от които искате да изтриете. Друго претоварване отнема диапазон от клетки, флага за показване на наличието на заглавка в данните и накрая списъка с индекси на колони, където искате да сравните данни в дадения диапазон.

Тази статия ни научи как да елиминираме дублиращи се записи в Excel с Python. За да премахнете формули от файла на Excel, вижте статията на как да премахнете формула в Excel с помощта на Python.

 Български