
Я пытаюсь использовать Excel для анализа большого набора данных пациентов (>16 000 записей). Каждый пациент идентифицируется числовым идентификатором пациента и регистрируется при каждом посещении. Это означает, что некоторые пациенты представлены в этой базе данных только один раз, тогда как другие появляются более 10 раз.
Прямо сейчас я пытаюсь придумать способ объединить идентификатор пациента с полом пациента, чтобы каждый пациент учитывался только один раз. Позже я хотел бы сделать то же самое с разными возрастными группами, в основном младше и старше 18 лет.
В общих чертах это выглядит так:
Любая помощь будет оценена по достоинству.
решение1
Очистка дубликатов из набора данных, подобного этому, для получения уникальных записей может быть выполнена в Excel с помощью опции Данные => Удалить дубликаты на ленте. Можно выбрать несколько полей (даже все поля) в выбранном диапазоне/таблице. Ниже приведен общий пример того, как это может выглядеть.
Для анализа различных возрастных групп я бы рекомендовал использовать «вспомогательный столбец» с формулой для отметки записей в соответствии с желаемыми критериями. Например, =IF(D4<18,"< 18 y.o.",">= 18 y.o.")
затем создать сводную таблицу, отобразить результаты в табличном формате и отфильтровать сводную таблицу по вспомогательному столбцу.