본캠프/TIL ♨

[TIL 8일차] 아드레날린 하루: TIL을 쓰기엔 프로젝트 마감 임박으로 심장이 두근

yssummer 2025. 2. 27. 22:42

 

분석 프로젝트를 하루 종일 하고 있기 때문에 그 자료를 첨부하는 게 좋을 것 같다.

 

 

오늘 머리싸매고 새로 써본 쿼리는 이렇다.

 

----

구할 것 : 
마케팅 예산 어디에 써야 효율적일지 판단하기 위해 
매출이 가장 높았던 2019년 11월 데이터로 유저별 매출기여도를 계산해보고자 했습니다.

구매금액이 높은 순으로 나열했을 때 상위 20%인 고객(중복제거, 6505명)이 11월 매출에서 약 몇프로를 차지하는지 알아보니, 53.44%였습니다. 

1.구매한 모든 유저수 (중복제거)=31524명
select count(distinct user_id) as user_amount
from `2019_nov`user_id
where event_type = 'purchase'

2. 이들의 구매액 총합=153만1017달러
select SUM(price) AS s
from `2019_nov`
where event_type = 'purchase'
;--이들의 구매액 총합=153만1017달러

3. 유저(중복제거) 20%의 수=6505명
   ( 31524x0.2=약 6505)

4. 구매금액이 높은 순으로 나열한 20%의 구매액 총합=81만8297달러
select sum(user_purchased_price)
from
(SELECT 
distinct(user_id), 
SUM(price) AS user_purchased_price
      FROM ecom.`2019_nov` n 
      WHERE event_type = 'purchase'
     group by user_id
     ORDER BY user_purchased_price DESC
     LIMIT 6505
) s

5. 분석결과
구매 금액 높은순으로 나열한 고객 6505명(전체의 20%) 이 전체매출에서 차지하는 비율이 53.44%이다. 

 

 

 

또 조사한 것.

코로나의 영향이 있는지도 분석했었는데, 아닌 것으로 보여.
저희의 분석 데이터 기간에, 코로나 영향이 약간은 있지만 미미하다고 봐야할 것 같습니다.  그 이유는 DBR 아티클이랑, statista의 us ecommerce 2019-2029 revenue 자료에 나온건데, 2020년 하반기 되어서 코로나 영향받아 폭발적 증가했고요(전년 동기 대비 33% 증가) , 2020년 1,2월에는 그 전 10년과 비슷한 성장률(15-15%대 유지해왔음) 입니다. 따라서 코로나 영향으로 해석하는 것은 줄이겠습니다.
이커머스 시장 전체가 커지는 성장 영향은 최소 2월부터 시작입니다. 근데 우리 데이터는 2월에 끊기니까, 그 전 10년 간의 안정적인 성장세의 영향권에 있습니다. 그들과 비교분석하면 될 것 같습니다.

다만 판데믹이라는 위험요소가 2월 매출 한군데에는 영향 주었을 수 있다고 생각합니다.
1월 중순에 시작되었으므로 2월에는 판데믹에 대응하는 움직임이 필요했을 것입니다. 그 때 발빠르게 움직이지 못한 온라인 쇼핑몰은 다른 곳에 고객을 많이 빼앗길 수 있었을 것입니다.
(참고- 동아비즈니스리뷰(DBR) 21년 8월호 아티클:
미국의 온라인 쇼핑 디지털로의 전환이 얼마나 가팔랐는지 설명:
10년이 걸리는 디지털 전환을 단 몇달만에 이룸. 전체 소매 판매액 중 이커머스 판매 비중이 총 5.6%에서 16%로 10.4%포인트 증가하는데는 10년이 걸렸음. 그러나 2020년 2월부터 4월까지 단 두 달 만에 11%포인트가 증가함. 그래거 그 비중이 총 27%에 도달.)

 

쿼리 작성 시행착오

구매전환율, 매출기여도 이런 것들 찾아내려고 열심히 공부했뜸...