В этом кратком руководстве описан процесс удаления повторяющихся строк в Excel с помощью Python. В нем есть подробная информация по настройке среды разработки, список шагов по написанию приложения и пример кода для устранения повторяющихся строк в Excel с помощью Python. В нем будут обсуждаться различные варианты удаления повторяющихся строк путем установки разных параметров.
Действия по удалению повторяющихся строк в Excel с помощью Python
- Настройте IDE на использование Aspose.Cells для Python через Java для удаления повторяющихся строк.
- Загрузите файл Excel в объект Workbook.
- Доступ к коллекции ячеек с выбранного листа
- Вызовите метод removeDuplicates(), чтобы удалить все повторяющиеся строки из листа.
- Вызовите метод removeDuulates() с определенным диапазоном, чтобы исключить повторяющиеся строки.
- Вызовите метод RemoveDuulates() с диапазоном ячеек и флагом для заголовков и целевых столбцов.
- Сохраните вывод
Вышеупомянутые шаги объясняют процесс удаления повторяющихся записей в Excel с помощью Python. Начните процесс с загрузки исходного файла Excel в объект класса Workbook и вызова различных вариантов метода RemoveDuplications(). Сохраните выходной файл Excel после удаления нужных повторяющихся строк из исходного файла.
Код для удаления повторяющихся строк в Excel с помощью Python
import jpype | |
import asposecells as cells | |
jpype.startJVM() | |
from asposecells.api import License, Workbook | |
# Instantiate a license | |
license = License() | |
license.setLicense("License.lic") | |
book = Workbook("removeduplicates.xlsx") | |
# Remove duplicates from the entire sheet | |
book.getWorksheets().get(1).getCells().removeDuplicates() | |
# Remove duplicate from the defined range | |
book.getWorksheets().get(0).getCells().removeDuplicates(0,7,5,10) | |
# Remove Duplicates based on data from the selected columns | |
cols = [ 0, 3 ] | |
book.getWorksheets().get(0).getCells().removeDuplicates(0, 0, 6, 3,True,cols) | |
# Save result | |
book.save("removeduplicates-result.xlsx") | |
print("Duplicate rows removed successfully") |
Этот код объясняет, как удалить повторяющиеся записи в Excel с помощью Python. Метод RemoveDuulates() без каких-либо аргументов удалит все повторяющиеся строки из целевого листа, а вторая перегрузка с начальными и конечными ячейками определяет диапазон ячеек, из которых вы хотите удалить. Другая перегрузка принимает диапазон ячеек, флаг, показывающий наличие заголовка в данных, и, наконец, список индексов столбцов, в которых вы хотите сравнить данные в заданном диапазоне.
Эта статья научила нас, как устранить повторяющиеся записи в Excel с помощью Python. Чтобы удалить формулы из файла Excel, обратитесь к статье как удалить формулу в Excel с помощью Python.