私は Excel を使用しています。多数の変数で構成されるデータセットがあります。残念ながら、このデータセットは複数の人によって入力されており、同じ形式が維持されていません。そのため、次のような複数の形式のデータを含むデータセットがあります。
変数1 変数2 変数3 変数4 変数5 ... xx X1 X2 x ...
ここで問題となるのは、Var3 と Var4 です。どちらも複数行の情報を含んでいます。まずは Var3 から始めましょう。これには 1 つの数字が含まれているはずですが、4+2 と入力されていることがあります。これは、同一の行が 1 つではなく 2 つあることを意味します。ただし、1 つには Var3=4 が含まれ、もう 1 つには Var3=2 が含まれます。さらに、このデータは、次の形式で入力されています: x+x; x+x+x+...
さらに、個人の性別が含まれる場合があり、データは 2f2m または 1m+x と記述されます。ここで、f/m は性別を表します (今のところは無視します)。つまり、2f2m は 4 と読み取られ、1m+1 はそれぞれ Var3=1 の 2 つのエントリと読み取られるはずです。
Var4 については、通常は問題にはなりませんが、場合によっては、この情報も Var3 の値とともに複数の行に分割する必要があります。たとえば、Var3=2+1 で Var4=2OL1R の場合、必要なのは 2 行です。1 つは Var3=2 Var4=OL、もう 1 つは Var3=1 Var=R です。ただし、この 2 番目の問題は今のところそれほど重要ではありません。
Excel データ操作の経験は限られています。通常は R を使用しますが、それでもこの問題を解決する方法がわかりません。どなたか正しい方向を示していただけませんか? どの用語/関数を探せばよいのかわかりません。