본캠프/TIL ♨

[54일차] 프로젝트 7일차, 경제 지표 통계자료 조사, ppt 제작 기초작업, 클러스터링 완성 후 검정까지.

yssummer 2025. 4. 28. 22:01

오늘 카드 기획 인사이트를 내기 : 2010~2019년 실제 경제 동향을 조사하고 우리 결과와 연결하여 아이디어 생성하기를 했다.

다른 팀원분들은 실루엣 계수를 끌어올리고 검정작업 마치고 코드를 완성하기 위한 작업을 하셨다.

경제 지표에 적셔진 하루였다. 지표랑 그래프 보는 게 공부 돼서 재미있었다. 

 

오늘 한 일 목차는 아래와 같다.
#1. 노션 페이지에 배경 지식 정돈 작업
1. 노션페이지 생성
2. 데이터 통계자료와 웹사이트 노션 페이지에 모두 첨부
3. 통계 그래프 이미지 출처에서 가져오거나 생성해서 따로 노션에 첨부 (정말 힘들었다)
4. 자료 필요 시 번역

#2. 생각 뽑기 작업
1. 피그마에 사진이랑 표 펼쳐놓고 연결고리, 인사이트 뽑기
2. 우리 데이터랑 시각화 완성된 거 나오면 한바닥에 놓고 보기

3. 우리 클러스터링 결과 분석해서 정리 적어놓기.

 

오늘은 여기까지 했으며, 아래는 아마 내일 할 일이다.

#여기부터는 영호님 바통터치 느낌인가(?) 일단 나 내일 이어서 할 계획 적은 것임.  

완성된 시각화 보면서 분석 시작 --> 
3. 시작부터 끝까지 논리 전개 글로 써보고 아닌 부분 보충하기 (지금 글 쓰면 지쳐서 죽을 수도 있을듯.)
4. 통계와 우리데이터 겹쳐서 함께 강조할거 있음 자료 생성하기.
5. ppt 목차랑 자료배치 정착시키기

 

아래 사진들은 오늘의 아웃풋이다. 내가 본 통계자료랑. 생성한 그래프도 있고... 노션에 아이디어 적어두었다.

예측 기반 카드 기획: 공식 예측 지표와 클러스터링 결과를 함께 이해하고 2020년의 소비자 카드 사용 행동을 예측하여 적절한 기획하기. 라는 제목이다.

 

 

요거는 팀원분들이 클러스터링 마무리한거... 감사의 인사를...

내가 클러스터링 마무리에 참여할 시간은 없었다.  

어제 실루엣 계수 0.1도 나오지 않는 k=3 돌려본거로 만족해야겠네....

0.07이었는데 0.7로 보고 혼자 신났었는데 충격적으로 낮은 실루엣점수였던 것이다 어쩐지 전혀 군집 분리가 안됐었는데 항상 분리되지 않은 군집만 보다 보니까 감이 없었던 것 같다

아래 군집 나름 깔끔히 분리된 것 보니까 아 저럴수도 있는 것이었어?! 하는 생각이 든다 ㅋㅋㅋㅋ

피처 중요도 같은 거는 개인적으로 잘 나왔다고 생각 든다.

금융에서 실제로 중요한 느낌으로 현실적으로 나온 것 같음. 

 

 

최종 클러스터 분석

  • 중요한 피처 고른 것: 신용점수/ 나이/ 거래금액 /부채/ 연소득. 나머지는 중요도 낮아 제외. (만일 소비패턴을 보고자 하면 use_chip을 사용 가능)
  • 실루엣 계수 0.33
    • Cluster 0: 432명
    • Cluster 1: 314명
    • Cluster 2: 52명 (소수) 소수 클러스터 2의 특성 따로 주의해서 분석해야 한다
    • Cluster 3: 240명
    • Cluster 4: 181명
  • 클러스터 수: 5개
  • ANOVA 검정 결과부채 차이도 구분에 큰 역할했음. 보유 카드 수 차이도 존재했는데 금융활동 적극성 차이라고 볼 수 있음.
  • 소득 > 연령 > 부채 > 신용 상태가 군집의 핵심 구분 요인 연소득, 연령 군집 구분에 핵심적. (고소득-저소득, 젊은층-노년층 차이가 뚜렷함. )
  • Chi-Square 검정 결과 성별, 카드 브랜드, 오프라인/온라인 여부, 카드 카테고리 등은 군집 간 큰 차이 없음. 경제 활동과 관련한 게 더 중요.
  • 미국 2010~2020 경제지표와 연결 분석고소득 고신용 / 저소득 고부채 계층이 확실히 나뉘고 있는 것으로 보임.
  • 각각을 위한 카드 확실히 구분해서 만들 필요 있어보여요.
  • 경제 데이터 살펴보니 경제는 좋아졌지만, 부채·신용 리스크가 계속 증가되고 있음. 이 현실처럼 → 지금 군집들 안에서도 소득차이 부채차이로