У меня есть набор данных, содержащий 3 столбца.
- Персональный идентификационный номер
- сфера занятости
- месяцев опыта работы в данной сфере занятости
У меня есть большое количество дубликатов, где человек имеет опыт в двух или более областях занятости. Я хочу сузить свой набор данных, чтобы ни один личный идентификатор не имел дубликатов. Критерием является область занятости, где человек имеет наибольший опыт.
Мой набор данных выглядит так:
a b c
teacher ID99999 38
teachers assistant ID99999 6
решение1
Это можно сделать с помощью вспомогательного столбца в столбце D.
- Введите эту формулу массива в D2:
=IF($C2=MAX(IF($A2=$A$2:$A$20,$C$2:$C$20,-1)),"Remain","Remove")
Примечание:Введите формулу с помощью Ctrl+Shift+Enter и заполните ее.
Отфильтруйте столбец D по параметру «Удалить».
Наконец, удалите отфильтрованные строки.
Эта формула найдет максимальный стаж в месяцах в столбце C для дубликатов ID и пометит эти строки как «Остаться». Другие строки с дубликатами ID помечаются как «Удалить».