170+ Spalten, Anzahl der Zeilen mit sich wiederholenden (duplizierten) Daten zählen

170+ Spalten, Anzahl der Zeilen mit sich wiederholenden (duplizierten) Daten zählen

Ich betrachte einen großen Datensatz mit mehr als 170 Spalten und 10.000 Zeilen und möchte die Daten in der Tabelle zusammenfassen, indem ich zähle, wie oft ein bestimmter Deskriptor verwendet wird.

Im Beispiel-Screenshot unten enthält eine Spalte Zeilen mit sich wiederholenden Informationen, also habe ich eine Wertespalte hinzugefügt, die Zeilen in dieser Spalte auf = 1 gesetzt und dies mithilfe einer Pivot-Tabelle summiert.

Bei einem viel größeren Datensatz ist die Verwendung einer Pivot-Tabelle jedoch nicht effizient. Gibt es eine bessere Möglichkeit, die doppelten Daten in den Zeilen zu zählen? Power Query?

Beispielergebnisse:

Bildbeschreibung hier eingeben

Antwort1

Ich würde hierfür Power Query verwenden. Es verfügt über eine Unpivot-Funktion, mit der Spalten in Zeilen mit Attribut- und Wertspalten (für die Spaltenüberschrift und den Zellenwert) umgewandelt werden können. Der Trick besteht darin, die Option „Erweitert“ im Unpivot zu verwenden, um die Aggregation der Zellenwerte zu vermeiden.

Sie müssten eine eindeutige Spalte aus dem Unpivot heraushalten, um die ursprüngliche Zeilenanzahl beizubehalten. Oder Sie könnten eine Indexspalte hinzufügen, um Zeilennummern in Excel zu emulieren.

Von dort aus können Sie eine Pivot-Tabelle verwenden, oder Power Query kann nach „Gruppieren“ und „Zählen“ arbeiten.

Antwort2

Der Autor möchte ganz offensichtlich Zeilen zählen, in denen Einträge wie „Kundenpreis“ vorkommen. Andernfalls ergibt die Idee, dass die Pivot-Tabelle eine Spalte mit Einsen summiert, um diese Zahlen zu erhalten, keinen Sinn.

COUNTIFwurde hierfür erfunden.

verwandte Informationen