
Я использую Mac Office 2011 под управлением Lion.
У меня есть таблица со многими тысячами строк данных, с хорошими 40 или 50 столбцами. Один столбец — адрес электронной почты. Если в любых двух строках есть повторяющийся адрес электронной почты, я хотел бы сохранить только одну из строк.
В идеале, при обнаружении дубликатов, по умолчанию сохранялась бы строка с определенным значением («Y») в определенной ячейке, если это применимо. Но даже если бы сохранялась только первая или последняя, это было бы улучшением.
Кроме того, один и тот же адрес электронной почты может легко встречаться более двух раз, поэтому решение должно быть способно обрабатывать произвольное количество дубликатов.
Я попробовал решение, предложенное здесь -Удалить дубликаты строк в Excel, если не все столбцы одинаковы- но мне это ничего не дало.
Спасибо за любые предложения!
решение1
Я не знаю конкретно Mac Excel, но считаю, что следующий подход работает почти для всех приложений электронных таблиц:
- Перейти кпустой столбец.
- Используйте
=COUNTIF(A:A,A2)
функцию. A:A — столбец, содержащий адреса электронной почты, а A2 — ближайшая ячейка, содержащая адрес электронной почты. - Скопировать указанную формулуко всей колонке.
- «1» возвращается для уникальных значений, все, что больше «1», означаетдублированное значение.
- Сортироватьпо электронной почте, если вы хотите, чтобы в строках соседних ячеек были дубликаты.
- Использоватьфильтрчтобы скрыть недублирующиеся значения (т.е. скрыть единицы) илисортировать по новому столбцу по убываниючтобы поместить все дубликаты наверх таблицы.
- Кроме того, вы можете использоватьфильтрв другом столбце (содержащем «Y» или что-либо еще) для разделения писем, которые вы хотите оставить, и тех, которые нужно удалить.