RFM Analysis , Cohort Analysis 를 통한 고객 세그먼트 분석을 와 비즈니스 솔루션(고객 맞춤 구독박스 서비스)
2024. 2. 26. 20:42ㆍData Analyst Project
이커머스 고객 세분화 분석 아이디어 경진대회 - DACON
이커머스 고객 세분화 분석 아이디어 경진대회 - DACON
분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다.
dacon.io
작성완료한 PPT 자료 다운로드 링크
문제정의
- 고객 행동 및 구매 패턴 분석
- 고객 행동과 구매 패턴을 이해하여 특정 구매 특징 도출.
- 고객 세분화를 통한 맞춤형 마케팅 전략 수립
- 고객 세분화를 통해 그룹별 맞춤형 마케팅 전략 제안.
- 고객 유지율 향상 및 이탈 방지
- 고객 이탈 원인 분석을 통한 유지 전략 수립 및 재방문 유도.
- 마케팅 투자 효율성 평가
- 마케팅 예산 최적화 및 채널별 효율 비교를 통한 투자 전략 수립.
- 쿠폰 사용 효과성 검증
- 쿠폰 제공의 구매 전환 효과 분석 및 최적의 쿠폰 전략 수립.
문제해결
1. 고객 세분화 (클러스터링)
- 기법: K-평균(K-means) 클러스터링을 사용하여 고객을 다양한 특징에 따라 그룹화.
- 목적: 고객의 구매 패턴과 선호도를 분석하기 위해, 유사한 행동을 보이는 고객을 그룹으로 묶어 각 클러스터에 맞춘 전략을 세우는 데 활용.
- 결과: 각 클러스터별로 성별, 구매 빈도, 거래 빈도 등이 다르게 나타났고, 이를 기반으로 특정 고객 그룹에 더 적합한 제품이나 마케팅을 제안.
2. 시계열 분석
- 기법: 거래 데이터를 바탕으로 특정 시즌(예: 겨울 연휴)에 따른 구매 패턴을 파악하기 위해 시계열 분석을 진행.
- 목적: 구매 패턴이 시간에 따라 어떻게 변화하는지 확인함으로써, 특정 시즌에 맞춘 마케팅 전략(예: 연휴 시즌 할인)
- 결과: 연말 연휴에 특정 클러스터의 거래가 증가하는 패턴이 확인되었고, 이를 바탕으로 특정 시점에 집중할 마케팅 전략이 제안.
3. 상관관계 분석
- 기법: 마케팅 비용(온라인 및 오프라인)과 총 구매 금액 간의 상관관계를 파악하기 위해 상관계수 분석을 활용.
- 목적: 마케팅 비용을 효율적으로 사용하기 위해 어떤 채널(온라인, 오프라인)이 고객의 구매 행동에 더 큰 영향을 미치는지 확인하는 것이 목표.
- 결과: 클러스터별로 마케팅 비용과 구매 금액 간의 상관관계가 다르게 나타났으며, 특히 온라인 마케팅 비용이 더 민감하게 반응하는 클러스터를 파악.
4. 코호트 분석
- 기법: 코호트 분석을 통해 신규 고객의 첫 거래 이후 시간이 지남에 따라 고객 유지율을 분석.
- 목적: 고객의 유지율과 이탈률을 분석하여, 첫 거래 이후 얼마만큼의 고객이 재방문하는지 확인하고, 이탈 고객을 줄이기 위한 전략을 마련하는 데 사용.
- 결과: 첫 거래 후 시간이 지나면서 고객 수가 감소하는 경향이 발견되었고, 특히 초기 활동성이 높은 고객을 타겟으로 한 유지 전략이 필요함을 시사.
- 각 카테고리별 첫 구매 월과 시간(코호트 인덱스)에 따른 구매 횟수의 변화를 분석해, 구매 패턴과 관심도의 변화를 파악
5. 범주별 분석 (카테고리별 선호도 분석)
- 기법: 성별 및 지역에 따른 구매 카테고리 선호도를 분석하여 고객 세분화된 특징에 따른 제품 선호도를 파악
- 목적: 고객 그룹이 어떤 상품을 더 선호하는지 파악하여 개인화된 제품 추천이나 타겟 마케팅 전략에 활용하는 것이 목적
- 결과: 특정 클러스터에서는 Apparel, Nest-USA와 같은 카테고리가 주로 선호된다는 결과를 얻었고, 이를 기반으로 더 개인화된 상품 추천
6. 쿠폰 사용 및 효과 분석
- 기법: 쿠폰 클릭률과 사용률을 분석하여 고객이 쿠폰을 얼마나 활용하는지에 대한 통계를 파악
- 목적: 쿠폰 제공이 고객의 구매 결정에 얼마나 기여하는지, 그리고 이를 통해 구매 전환율을 얼마나 높일 수 있는지 확인하는 데 중점
- 결과: 쿠폰 클릭률은 남녀 비슷하게 나타났지만 사용률에서 차이가 있었고, 이로 인해 특정 고객층을 대상으로 한 쿠폰 마케팅의 효율성을 평가
결과
- 고객 클러스터별 선호 상품 및 결제 방식
- 1번 클러스터의 고가 브랜드 상품 선호와 신용카드 결제 방식
- 2번 클러스터의 실용적 가격대 상품 선호와 간편결제 사용 비율의 증가
- 상품별 코호트 분석 결과
- A상품군의 3개월 이내 재구매율 40% 및 할인 쿠폰 제공 시 재방문율 증가
- B상품군의 6개월 내 재구매율 25% 및 유지율 상대적 저조
- 고객 라이프사이클 단계별 선호 상품
- 초기 고객의 할인 제품 및 적립 혜택 선호
- 중기 고객의 프리미엄 제품 선호 증가 경향
- 장기 고객의 품질 및 브랜드 가치 중시
- 결제 방식과 소비 패턴의 상관관계
- 젊은 연령대 클러스터의 모바일 간편결제 비율 70%와 소액 반복 구매 선호
- 고연령대 클러스터의 신용카드 및 고액 결제 방식 선호
- 클러스터별 마케팅 전략 수립 가능성
- 고객 유지율 및 매출 증대에 기여하는 최적화된 전략 설계
주요코드
# 주문 데이터와 고객 데이터 병합
orders_customers_df = pd.merge(orders_df, customers_df, on='Customer_id', how='inner')
# 주문 데이터와 주문 아이템 데이터 병합
orders_items_combined_df = pd.merge(orders_customers_df, order_items_df, on='Order_id', how='inner')
# 주문 아이템 데이터와 제품 데이터 병합
orders_items_products_df = pd.merge(orders_items_combined_df, products_df[['Product_id', 'Product_category_name']],
on='Product_id', how='left')
# 주문 데이터와 리뷰 데이터 병합
orders_reviews_df = pd.merge(orders_items_products_df, reviews_df, on='Order_id', how='left')
# 판매자 데이터와 주문 데이터 병합
orders_sellers_df = pd.merge(orders_reviews_df, sellers_df, on='Seller_id', how='left')
# 판매자 데이터에 지역 데이터 추가
orders_sellers_locations_df = pd.merge(orders_sellers_df, locations_df,
left_on='Seller_zipcode_prefix',
right_on='Geolocation_zipcode_prefix',
how='left')
# 8. 결제 데이터를 추가하여 최종 병합
final_combined_df = pd.merge(orders_sellers_locations_df, payments_df, on='Order_id', how='left')
# 9. 데이터 전처리
# 결측치 처리
final_combined_df.fillna({'Review_score': 0, 'Product_category_name': 'Unknown'}, inplace=True)
# 날짜 데이터 변환
final_combined_df['Order_purchase_timestamp'] = pd.to_datetime(final_combined_df['Order_purchase_timestamp'])
데이터 간의 공통 키를 기준으로 단계적으로 병합:
- 고객 데이터 → 주문 데이터.
- 주문 데이터 → 주문 아이템.
- 주문 아이템 → 제품 정보.
- 주문 데이터 → 리뷰 데이터.
- 주문 데이터 → 판매자 데이터 → 지역 정보.
- 마지막으로 결제 정보 추가.
전체코드 링크
wonderfulawsome/E-commerce-Customer-Segmentation-Analysis-Idea-Contest (github.com)
GitHub - wonderfulawsome/E-commerce-Customer-Segmentation-Analysis-Idea-Contest
Contribute to wonderfulawsome/E-commerce-Customer-Segmentation-Analysis-Idea-Contest development by creating an account on GitHub.
github.com
'Data Analyst Project' 카테고리의 다른 글
| [코드 실습] 포트폴리오 최적화 (0) | 2024.03.21 |
|---|---|
| [데이콘]제주도 특산물의 가격을 예측하는 AI 모델 개발 및 인사이트 발굴 (1) | 2024.03.21 |
| [공모전]신재생에너지와 전기자동차 데이터분석(데이터 시각화와 예측,시나리오 모델링을 통한 아이디어 개발) (1) | 2024.02.05 |
| 데이터 분석 아이디어 경진대회(LDA(Latent Dirichlet Allocation) 분석) (1) | 2023.12.26 |
| 데이터 분석 아이디어 경진대회 EDA (0) | 2023.12.26 |