
저는 회사를 위해 소셜 미디어 보고를 하고 있는데 트위터 게시물의 통계적 분포를 살펴보고 싶습니다. 종속 변수는 참여율(%로 정의됨)이고 다양한 독립 변수는 시간, 요일, 사용된 해시태그 수 등이 될 수 있습니다.
변수를 표시하는 열이 포함된 트윗당 한 행씩 내 모든 트윗이 포함된 Excel 내보내기가 있습니다. Box and Whisker 플롯이 올바르게 작동하는 데 성공을 거두었습니다. 데이터 형식을 다시 지정해야 합니까? 그렇다면 어떻게? 그렇지 않다면 내가 뭘 잘못하고 있는 걸까요?
예를 들어 내 데이터는 다음과 같습니다.
HOUR OF DAY ENGAGEMENT %
08 1.02
17 0.98
12 1.88
그러나 상자 플롯은 그것을 좋아하지 않습니다 :( 트위터 시간 사진
요일 버전을 함께 해킹할 수 있었지만 월요일, 화요일, 수요일 등의 x축을 정렬하기 위해 처음 몇 행을 수동으로 다시 정렬해야 했습니다.
DAY ENGAGEMENT %
Thu 0.89
Mon 2.02
Tue 1.69
etc.
어떤 도움이라도 대단히 감사하겠습니다!