Ich habe einen Datensatz mit 3 Spalten.
- Persönliche ID-Nummer
- Beschäftigungsfeld
- Monate Berufserfahrung im jeweiligen Tätigkeitsbereich
Ich habe eine große Anzahl von Duplikaten, bei denen eine Person Erfahrung in zwei oder mehr Beschäftigungsbereichen hat. Ich möchte meinen Datensatz eingrenzen, sodass keine persönliche ID Duplikate enthält. Das Kriterium ist der Beschäftigungsbereich, in dem die Person die meiste Erfahrung hat.
Mein Datensatz sieht folgendermaßen aus:
a b c
teacher ID99999 38
teachers assistant ID99999 6
Antwort1
Sie können dies mithilfe einer Hilfsspalte in Spalte D tun.
- Geben Sie diese Matrixformel in D2 ein:
=IF($C2=MAX(IF($A2=$A$2:$A$20,$C$2:$C$20,-1)),"Remain","Remove")
Notiz:Geben Sie die Formel mit Strg+Umschalt+Eingabe ein und füllen Sie sie aus.
Filtern Sie Spalte D nach „Entfernen“.
Löschen Sie abschließend die gefilterten Zeilen.
Diese Formel ermittelt die maximale Anzahl an Monaten an Erfahrung in Spalte C für doppelte IDs und markiert diese Zeilen mit „Verbleiben“. Andere Zeilen mit doppelten IDs werden mit „Entfernen“ markiert.