
Estoy haciendo algunos informes de redes sociales para mi empresa y quiero ver la distribución estadística de las publicaciones de Twitter. La variable dependiente es la tasa de participación (definida como %) y las diversas variables independientes podrían ser la hora del día, el día de la semana, la cantidad de hashtags utilizados, etc.
Tengo una exportación de Excel con todos mis tweets, una fila por tweet, con columnas que muestran las variables. Estoy teniendo un éxito desigual al conseguir que un diagrama de caja y bigotes funcione correctamente. ¿Necesito volver a formatear mis datos? ¿Si es así, cómo? Si no, ¿qué estoy haciendo mal?
Por ejemplo, mis datos podrían verse así:
HOUR OF DAY ENGAGEMENT %
08 1.02
17 0.98
12 1.88
Pero al diagrama de caja no le gusta eso :( Imagen de la hora del día de Twitter
Pude crear una versión para el día de la semana, pero esto me implicó reordenar manualmente las primeras filas para alinear el eje x para lunes, martes, miércoles, etc.
DAY ENGAGEMENT %
Thu 0.89
Mon 2.02
Tue 1.69
etc.
¡Cualquier ayuda sería muy apreciada!