Más de 170 columnas, cuente el número de filas con datos repetidos (duplicados)

Más de 170 columnas, cuente el número de filas con datos repetidos (duplicados)

Estoy viendo un conjunto de datos grande, más de 170 columnas, 10.000 filas y quiero resumir los datos dentro de la tabla contando la cantidad de veces que se usa un determinado descriptor.

En la captura de pantalla de ejemplo siguiente, una columna contiene filas con información repetitiva, así que agregué una columna de valor, configuré las filas de esa columna en = 1 y lo sumé usando una tabla dinámica.

Sin embargo, con un conjunto de datos mucho mayor no es eficiente utilizar una tabla dinámica. ¿Existe una mejor manera de contar los datos duplicados en las filas? ¿Consulta de energía?

Resultados de ejemplo:

ingrese la descripción de la imagen aquí

Respuesta1

Usaría Power Query para esto. Tiene una función Unpivot que puede convertir columnas en filas, con columnas de Atributo y Valor (para el encabezado de columna y el valor de celda). El truco consiste en utilizar la opción Avanzada en Unpivot para evitar agregar los valores de las celdas.

Debería mantener una columna única fuera de Unpivot para preservar los recuentos de filas originales. O puede agregar una columna de índice para emular los números de fila en Excel.

Desde allí, puede usar una tabla dinámica o Power Query puede agrupar y contar.

Respuesta2

Es bastante claro que el autor quiere contar las filas en las que aparecen entradas como "Precio al cliente". De lo contrario, la idea de que la tabla dinámica sume una columna de 1 para proporcionar estos recuentos no tiene sentido.

COUNTIFfue inventado para esto.

información relacionada