Spark window 함수 예제 (공부용)
·
Study/SQL
1) 사용자별 최신 이벤트 1건만 남기기목표: user_id마다 가장 최근 event_time 1행만 남긴다.WITH t AS ( SELECT user_id, -- 사용자 식별자 event_time, -- 이벤트 발생 시간 payload, -- 부가 데이터(원하는 컬럼) ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY event_time DESC) AS rn -- PARTITION BY user_id: 사용자별로 그룹을 나눔 -- ORDER BY event_time DESC: 각 사용자 그룹 안에서 최신 시간이 먼저 오게 정렬 -- ROW_NUMBER(): 정렬된 순서대로 1,2..