
У меня есть набор данных, содержащий около 29 000 записей, относящихся к датам прибытия и отправления примерно 3000 уникальных лиц на службу и со службы за определенный период времени.
Я пытаюсь разбить использование услуг каждым отдельным лицом на отдельные эпизоды двумя отдельными способами:
1) ИспользуяКритерий выхода — 30-дневный разрыв, что означает, что все пребывания в службе, в которых разрыв между одним выходом и следующим входом составляет менее 30 дней, считаются частью одного дискретного эпизода. Таким образом, мне нужно построить формулу, которая позволит мне проверить, есть ли 30-дневный разрыв между тем, когда человек покинул службу, и затем снова вошел в нее (т. е. чтобы увидеть, покинул ли человек службу на период 30 дней до своего следующего входа), а затем суммировать количество эпизодов, связанных скаждая уникальная личностьв сервисе на основе этого 30-дневного критерия выхода. Эту формулу затем нужно будет применить ко всему набору данных.
2)То же самое, что и выше, за исключением использованияКритерий выхода с разрывом в 1 день.
Любая помощь или указания относительно того, как лучше это сделать, будут весьма признательны.
Заранее спасибо !