![Как проверить наличие дубликатов в отдельных файлах Excel](https://rvso.com/image/1419384/%D0%9A%D0%B0%D0%BA%20%D0%BF%D1%80%D0%BE%D0%B2%D0%B5%D1%80%D0%B8%D1%82%D1%8C%20%D0%BD%D0%B0%D0%BB%D0%B8%D1%87%D0%B8%D0%B5%20%D0%B4%D1%83%D0%B1%D0%BB%D0%B8%D0%BA%D0%B0%D1%82%D0%BE%D0%B2%20%D0%B2%20%D0%BE%D1%82%D0%B4%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D1%85%20%D1%84%D0%B0%D0%B9%D0%BB%D0%B0%D1%85%20Excel.png)
У меня есть несколько (~20) файлов Excel, и я хочу проверить, нет ли дубликатов данных (например, имени). Есть ли способ сделать это, не перебирая каждое имя в каждом файле? Спасибо!
решение1
Я бы использовал для этого надстройку Power Query. Вы можете запустить запрос из папки с файлами — он импортирует все файлы в папку Windows и может добавить все их данные вместе (при условии, что столбцы файла согласованы). Это требует нескольких шагов и немного возни с языком сценариев M, но строительные блоки и дальнейшая манипуляция данными — это point-and-click
Вот запись в блоге, в которой подробно описаны шаги по объединению файлов Excel:
http://dutchdatadude.com/combining-excel-files-using-power-query-for-excel/
Чтобы найти дубликаты, я бы продублировал запрос и использовал команду Group By в Power Query. Я бы сгруппировал по имени и вычислил бы количество. Любая строка с количеством > 1 является дубликатом. Затем вы можете вернуться к первому запросу (со всеми подробными строками) и объединить 2-й запрос, который находит дубликаты, объединив по имени.