
Ich erstelle für mein Unternehmen ein Social-Media-Reporting und möchte mir die statistische Verteilung von Twitter-Posts ansehen. Die abhängige Variable ist die Engagement-Rate (definiert als %) und die verschiedenen unabhängigen Variablen könnten Tageszeit, Wochentag, Anzahl der verwendeten Hashtags usw. sein.
Ich habe einen Excel-Export mit all meinen Tweets, eine Zeile pro Tweet, mit Spalten, die die Variablen zeigen. Ich habe unterschiedliche Erfolge damit, ein Box- und Whisker-Diagramm richtig zum Laufen zu bringen. Muss ich meine Daten neu formatieren? Wenn ja, wie? Wenn nicht, was mache ich falsch?
Meine Daten könnten beispielsweise so aussehen:
HOUR OF DAY ENGAGEMENT %
08 1.02
17 0.98
12 1.88
Aber dem Boxplot gefällt das nicht :( Twitter Stunde des Tages Bild
Ich konnte eine Version für den Wochentag zusammenhacken, musste dazu aber die ersten paar Zeilen manuell neu anordnen, um die X-Achse für Mo, Di, Mi usw. in eine Linie zu bringen.
DAY ENGAGEMENT %
Thu 0.89
Mon 2.02
Tue 1.69
etc.
Jede Hilfe wäre sehr willkommen!