我正在使用 Excel。我有一個由許多變數組成的資料集。遺憾的是,該資料集是由多個未遵循相同格式的人輸入的。所以我有一個包含多種格式資料的資料集,如下所示:
變數1 變數2 變數3 變數4 變數5 ... xx X1 X2 x ...
這裡的問題是 Var3 和 Var4。它們都包含用於多行的信息。讓我們從 Var3 開始。這應該包含一個數字,但有時它被輸入為 4+2,這意味著應該有兩行而不是一行相同。保存一個包含 Var3=4 和一個包含 Var3=2。此外,該資料已輸入以下格式:x+x; x+x+x+...
此外,有時會包含個人的性別,並將資料寫成 2f2m 或 1m+x,其中 f/m 表示性別(目前我希望忽略)。這表示 2f2m 應讀取為 4,而 1m+1 應讀取為 2 個條目,每個條目的 Var3=1。
至於 Var4,通常這不是問題,但在某些情況下,該資訊也需要與 Var3 的值一起拆分為多行。例如,如果 Var3=2+1 且 Var4=2OL1R 那麼我需要的是 2 行。一種是 Var3=2 Var4=OL,另一種是 Var3=1 Var=R。儘管第二個問題目前不太重要。
我對 Excel 資料操作的經驗有限。通常我會使用 R,但即使如此我也不知道如何解決這個問題。有人能指出我正確的方向嗎?我不確定我應該尋找哪些術語/功能。