Ich verwende Excel. Ich habe einen Datensatz, der aus einer Reihe von Variablen besteht. Leider wurde dieser Datensatz von mehreren Personen eingegeben, die sich nicht an das gleiche Format gehalten haben. Daher habe ich einen Datensatz mit Daten in mehreren Formaten, der wie folgt aussieht:
Var1 Var2 Var3 Var4 Var5 ... xx X1 X2 x ...
Das Problem hier sind Var3 und Var4. Beide enthalten Informationen, die für mehrere Zeilen gedacht sind. Beginnen wir mit Var3. Dies sollte eigentlich eine einzelne Zahl enthalten, wurde jedoch manchmal als 4+2 eingegeben, was bedeutet, dass es zwei Zeilen statt einer geben sollte, die identisch sind. Außer dass eine Var3=4 und eine Var3=2 enthält. Darüber hinaus wurden diese Daten in den folgenden Formaten eingegeben: x+x; x+x+x+...
Außerdem wurde manchmal das Geschlecht einer Person angegeben und die Daten wurden als 2f2m oder 1m+x geschrieben, wobei f/m das Geschlecht bezeichnet (was ich vorerst ignorieren möchte). Das bedeutet, dass 2f2m stattdessen als 4 und 1m+1 als 2 Einträge mit jeweils Var3=1 gelesen werden sollte.
Was Var4 betrifft, ist dies normalerweise kein Problem, aber in einigen Fällen müssen diese Informationen zusammen mit den Werten von Var3 ebenfalls in mehrere Zeilen aufgeteilt werden. Wenn beispielsweise Var3=2+1 und Var4=2OL1R, bräuchte ich 2 Zeilen. Eine mit Var3=2 Var4=OL und eine mit Var3=1 Var=R. Dieses zweite Problem ist jedoch im Moment von geringerer Bedeutung.
Meine Erfahrung mit der Datenmanipulation in Excel ist begrenzt. Normalerweise würde ich R verwenden, aber selbst dann bin ich mir nicht sicher, wie ich dieses Problem lösen kann. Kann mir jemand weiterhelfen? Ich bin mir nicht sicher, nach welchen Begriffen/Funktionen ich suchen soll.