Удалите повторяющиеся строки в Excel с помощью Python

В этом кратком руководстве описан процесс удаления повторяющихся строк в Excel с помощью Python. В нем есть подробная информация по настройке среды разработки, список шагов по написанию приложения и пример кода для устранения повторяющихся строк в Excel с помощью Python. В нем будут обсуждаться различные варианты удаления повторяющихся строк путем установки разных параметров.

Действия по удалению повторяющихся строк в Excel с помощью Python

  1. Настройте IDE на использование Aspose.Cells для Python через Java для удаления повторяющихся строк.
  2. Загрузите файл Excel в объект Workbook.
  3. Доступ к коллекции ячеек с выбранного листа
  4. Вызовите метод removeDuplicates(), чтобы удалить все повторяющиеся строки из листа.
  5. Вызовите метод removeDuulates() с определенным диапазоном, чтобы исключить повторяющиеся строки.
  6. Вызовите метод RemoveDuulates() с диапазоном ячеек и флагом для заголовков и целевых столбцов.
  7. Сохраните вывод

Вышеупомянутые шаги объясняют процесс удаления повторяющихся записей в Excel с помощью Python. Начните процесс с загрузки исходного файла Excel в объект класса Workbook и вызова различных вариантов метода RemoveDuplications(). Сохраните выходной файл Excel после удаления нужных повторяющихся строк из исходного файла.

Код для удаления повторяющихся строк в Excel с помощью Python

import jpype
import asposecells as cells
jpype.startJVM()
from asposecells.api import License, Workbook
# Instantiate a license
license = License()
license.setLicense("License.lic")
book = Workbook("removeduplicates.xlsx")
# Remove duplicates from the entire sheet
book.getWorksheets().get(1).getCells().removeDuplicates()
# Remove duplicate from the defined range
book.getWorksheets().get(0).getCells().removeDuplicates(0,7,5,10)
# Remove Duplicates based on data from the selected columns
cols = [ 0, 3 ]
book.getWorksheets().get(0).getCells().removeDuplicates(0, 0, 6, 3,True,cols)
# Save result
book.save("removeduplicates-result.xlsx")
print("Duplicate rows removed successfully")

Этот код объясняет, как удалить повторяющиеся записи в Excel с помощью Python. Метод RemoveDuulates() без каких-либо аргументов удалит все повторяющиеся строки из целевого листа, а вторая перегрузка с начальными и конечными ячейками определяет диапазон ячеек, из которых вы хотите удалить. Другая перегрузка принимает диапазон ячеек, флаг, показывающий наличие заголовка в данных, и, наконец, список индексов столбцов, в которых вы хотите сравнить данные в заданном диапазоне.

Эта статья научила нас, как устранить повторяющиеся записи в Excel с помощью Python. Чтобы удалить формулы из файла Excel, обратитесь к статье как удалить формулу в Excel с помощью Python.

 Русский