
Я делаю отчеты о социальных сетях для своей компании и хочу посмотреть на статистическое распределение постов в Twitter. Зависимая переменная — это уровень вовлеченности (определяется как %), а различные независимые переменные могут быть часом дня, днем недели, количеством используемых хэштегов и т. д.
У меня есть экспорт Excel со всеми моими твитами, по одной строке на твит, со столбцами, показывающими переменные. Я с переменным успехом пытаюсь заставить диаграмму Box and Whisker работать правильно. Нужно ли мне переформатировать мои данные? Если да, то как? Если нет, то что я делаю неправильно?
Например, мои данные могут выглядеть так:
HOUR OF DAY ENGAGEMENT %
08 1.02
17 0.98
12 1.88
Но сюжету это не нравится :( Картинка дня в Twitter
Мне удалось скомпоновать версию для дня недели, но для этого мне пришлось вручную переупорядочить первые несколько строк, чтобы выровнять ось X для понедельника, вторника, среды и т. д.
DAY ENGAGEMENT %
Thu 0.89
Mon 2.02
Tue 1.69
etc.
Любая помощь будет высоко оценена!