
У меня есть таблица, которая выглядит примерно так:
Full Name | Email | Phone Number
--------- ------- -----------
Billy Bob [email protected] 8019929102
Sally Sue [email protected] 8013439403
Billy Bob 8013432343
[email protected]
Sally Sue
Joe So [email protected]
Я хочу удалить дубликаты на основе адреса электронной почты и оставить строку с наиболее полными данными (наиболее заполненными столбцами). После того, как я отправлю электронное письмо, я буду искать дубликаты на основе Полного имени, а затем номера телефона и т. д.
Это будет сделано почти для 500 000 строк данных.
решение1
Добавьте вспомогательный столбец, который подсчитывает количество полей. Затем вы можете выделить дубликаты.