Я использую Excel. У меня есть набор данных, состоящий из нескольких переменных. К сожалению, этот набор данных был введен несколькими людьми, которые не придерживались одного и того же формата. Поэтому у меня есть набор данных, содержащий данные в нескольких форматах, который выглядит следующим образом:
Вар1 Вар2 Вар3 Вар4 Вар5 ... хх Х1 Х2 х ...
Проблема здесь в Var3 и Var4. Они оба содержат информацию, предназначенную для нескольких строк. Давайте начнем с Var3. Он должен содержать одно число, однако иногда его вводили как 4+2, что означает, что должно быть две строки вместо одной, которые идентичны. Запомните, что одна содержит Var3=4, а другая Var3=2. Более того, эти данные были введены в следующих форматах: x+x; x+x+x+...
Кроме того, иногда включался пол индивидуума, и данные записывались как 2f2m или 1m+x, где f/m обозначают пол (который на данный момент я хочу проигнорировать). То есть 2f2m должно читаться как 4, а 1m+1 должно читаться как 2 записи с Var3=1 каждая.
Что касается Var4, обычно это не проблема, но в некоторых случаях эту информацию также необходимо разбить на несколько строк, вместе со значениями из Var3. Например, если Var3=2+1 и Var4=2OL1R, то мне понадобится 2 строки. Одна с Var3=2 Var4=OL и 1 с Var3=1 Var=R. Хотя эта вторая проблема сейчас менее важна.
Мой опыт работы с данными Excel ограничен. Обычно я использую R, хотя даже тогда я не уверен, как решить эту проблему. Может ли кто-нибудь указать мне правильное направление? Я не уверен, какие термины/функции мне следует искать.