我有一個大約的數據集。約 29,000 個相關條目一段時間內 3000 個唯一的個人進出服務的日期。
我試圖以兩種不同的方式將每個人的服務利用率分解為離散的事件:
1)使用30 天間隔退出標準,這意味著從一次退出到下一次進入的間隔小於 30 天的服務中的所有停留均被視為一個離散事件的一部分。因此,我需要建立一個公式,讓我能夠檢查一個人離開服務然後重新進入服務之間是否存在 30 天的間隔(即查看一個人離開服務的時間是否為 30 天)。 ,然後將與相關的劇集數相加每個獨特的個體基於此 30 天退出標準的服務。然後需要將該公式應用於整個資料集。
2)與上面相同,除了使用1 天差距退出標準。
任何有關如何最好地執行此操作的幫助或指導將不勝感激。
提前致謝 !