Estoy usando Excel. Tengo un conjunto de datos que consta de varias variables. Lamentablemente, este conjunto de datos fue ingresado por varias personas que no mantuvieron el mismo formato. Entonces tengo un conjunto de datos que contiene datos con múltiples formatos que tiene el siguiente aspecto:
Var1 Var2 Var3 Var4 Var5 ... xxX1X2x...
El problema aquí es Var3 y Var4. Ambos contienen información destinada a varias filas. Empecemos con Var3. Se supone que contiene un solo número, sin embargo, a veces se ha ingresado como 4+2, lo que significa que debería haber dos filas en lugar de una que sean idénticas. Guarde que uno contiene Var3=4 y otro Var3=2. Además, estos datos se han introducido con los siguientes formatos: x+x; x+x+x+...
Además, a veces se incluía el sexo de un individuo y los datos se escribían como 2f2m o 1m+x, donde f/m denota sexo (que por ahora deseo ignorar). Lo que significa que 2f2m debería leerse como 4 y 1m+1 debería leerse como 2 entradas con Var3=1 cada una.
En cuanto a Var4, normalmente esto no es un problema, pero en algunos casos esta información también debe dividirse en varias filas, junto con los valores de Var3. Por ejemplo, si Var3=2+1 y Var4=2OL1R entonces lo que necesitaría son 2 filas. Uno con Var3=2 Var4=OL y 1 con Var3=1 Var=R. Aunque este segundo problema tiene menos importancia por ahora.
Mi experiencia con la manipulación de datos de Excel es limitada. Normalmente usaría R, aunque aun así no estoy seguro de cómo resolver este problema. ¿Alguien podría indicarme la dirección correcta? No estoy seguro de qué términos/funciones debo buscar.