Data Analyst Project

< BrandBoost-Analytics ( 고객 세분화 및 마케팅 전략 )> EDA

ParkS2 2023. 11. 26. 12:47

wonderfulawsome/BrandBoost-Analytics (github.com)

 

GitHub - wonderfulawsome/BrandBoost-Analytics

Contribute to wonderfulawsome/BrandBoost-Analytics development by creating an account on GitHub.

github.com

브랜드 키워드 데이터:

Count: 각 날짜에 대해 3170개의 데이터 포인트가 있다. 이는 데이터셋에 있는 브랜드 수를 나타낸다.

Mean: 평균값은 날짜별로 약 3에서 5점 사이. 이는 평균적으로 브랜드들이 얻은 키워드 점수를 나타낸다.

Std (표준편차): 표준편차가 상대적으로 높은 것을 볼 수 있다 (20점대 후반에서 30점대 초반). 이는 키워드 점수가 브랜드마다 크게 다르다는 것을 의미.

Min: 최소값은 모든 날짜에서 0. 이는 어떤 브랜드는 해당 날짜에 키워드 점수가 전혀 없었다는 것을 나타낸다.

25%, 50%, 75%: 이 백분위수들은 데이터 분포의 중간 지점을 보여준다. 예를 들어, 중앙값(50%)은 대부분 0.3에서 0.5 사이.

Max: 최대값은 일부 날짜에서 600점 이상으로 매우 높다. 이는 특정 브랜드가 매우 높은 키워드 점수를 받았음을 나타낸다.

 

판매 데이터:

Count: 각 날짜별로 대략 15700개에서 15800개의 데이터 포인트가 있다. 이는 각 날짜별 제품의 판매 기록 수를 나타낸다.

Mean: 평균 판매량은 대부분의 날짜에서 60000에서 90000 사이.

Std (표준편차): 표준편차가 매우 높다 (약 200000에서 300000), 이는 판매량이 제품마다 크게 다르다는 것을 의미.

Min: 최소 판매량은 모든 날짜에서 0. 이는 어떤 제품은 해당 날짜에 전혀 팔리지 않았다는 것을 나타낸다.

25%, 50%, 75%: 대부분의 날짜에서 50% (중앙값)는 0. 이는 절반 이상의 제품이 해당 날짜에 판매되지 않았음을 의미.

Max: 최대 판매량은 일부 날짜에서 200만 이상으로 매우 높다. 이는 특정 제품이 매우 높은 판매량을 기록했음을 나타낸다.

 

약한 상관관계:

이 데이터에서 브랜드 키워드 점수와 판매량 사이의 관계는 매우 약하다. 이는 브랜드 키워드 점수가 판매량에 크게 영향을 미치지 않음을 시사한다. 다시 말해, 높은 키워드 점수가 반드시 높은 판매량을 의미하지는 않는다.

 

그래프를 보면, 브랜드 키워드 점수가 증가함에 따라 평균 매출에 대한 명확한 상승 추세나 하락 추세를 바로 알아볼 수는 없다. 점들이 넓게 퍼져 있어서, 두 변수 사이에 강한 선형 상관관계가 있다고 말하기 어렵다. 그럼에도 불구하고, 점수가 4.0에서 4.8 사이 범위에서는 평균 매출이 상대적으로 높게 분포하는 경향이 있는 것으로 보인다.

Top 10 Product Types (상위 10개 제품 유형):

건강기능식품 (Health Functional Product)

일반식품 (General Food)

농축액 (Concentrate)

비타민C (Vitamin C)

1포 (One Pack)

정 (Tablet)

캡슐 (Capsule)

추출액 (Extract)

비타민D (Vitamin D)

아연 (Zinc)

Top 10 Target Audiences (상위 10개 대상 소비자 그룹):

성인남녀 (Adults, Male and Female)

유아 (Infants)

성인여성 (Adult Females)

성인남성 (Adult Males)

임산부 (Pregnant Women)

어류 (Fish - Possibly as an ingredient source)

물과 (With Water - Possibly referring to intake method)

캡슐 (Capsule - Possibly referring to form)

시니어 (Seniors)

비타민C (Vitamin C - Possibly as a target audience with a specific nutritional need)

Top 10 Ingredients (상위 10개 성분):

DHA+EPA: 600mg

비타민C: 100mg (Vitamin C: 100mg)

루테인: 20mg (Lutein: 20mg)

비타민E: 11mg (Vitamin E: 11mg)

실리마린: 130mg (Silymarin: 130mg)

비타민C: 1000mg (Vitamin C: 1000mg)

진세노사이드: 7mg (Ginsenoside: 7mg)

칼슘: 300mg (Calcium: 300mg)

비타민E: 25mg (Vitamin E: 25mg)

비타민C: 500mg (Vitamin C: 500mg)

그래프를 보면, 두 변수 사이에 명확한 선형 관계가 보이지 않는 것 같다. 이는 브랜드 키워드 점수가 판매량과 직접적이고 강한 연관성이 없을 수 있음을 시사.

그래도 5점이상의 점수를 얻은 브랜드는 평균 판매량이 대체로 40000 이상인것을 알수있다.

비즈니스 전략 제안

분석 결과를 바탕으로 다음과 같은 비즈니스 전략을 제안:

시즌별/이벤트별 마케팅 캠페인: 고객 활동이 증가하는 특정 날짜나 기간에 맞춰 마케팅 캠페인을 집중. 예를 들어, 상위 활동 날짜를 기반으로 특별 프로모션을 계획할 수 있다.

주기적 프로모션: 주말이나 특정 요일에 활동이 증가하는 경향을 이용하여 정기적인 프로모션을 진행. 예를 들어, 주말마다 특별 할인이나 이벤트를 개최할 수 있다.

고객 참여 유도: 고객 활동이 낮은 기간에는 고객 참여를 유도하는 캠페인을 진행. 예를 들어, 충성도 프로그램, 새로운 제품 출시, 대화형 마케팅 등을 통해 고객의 관심을 끌 수 있다.

데이터 분포:

분석된 데이터 포인트들은 주로 낮은 브랜드 키워드 언급 빈도와 낮은 매출 수준에 집중되어 있다. 이러한 분포는 대다수의 날짜에 브랜드 키워드 언급 빈도가 낮으며, 이러한 날짜에 매출도 상대적으로 낮은 경향이 있음을 시사한다.

경향성 분석:

산점도에서 나타난 경향성은 브랜드 키워드 언급 빈도가 증가함에 따라 매출이 증가하는 경향을 암시한다. 그러나 이러한 경향은 상대적으로 약하며, 고빈도 및 고매출 데이터 포인트의 부족으로 인해 명확한 상관 관계를 확립하기 어렵다.

이상치 분석:

특별히 높은 매출을 기록한 날짜들이 관찰된다.

이러한 이상치들은 특별한 이벤트, 프로모션, 시즌 등에 의한 것일 수 있으며, 이는 브랜드 키워드 언급 빈도와 직접적인 관련이 없을 수도 있다.

 

 

-이전글-

고객 세분화 및 마케팅 전략 기획서 (tistory.com)

 

고객 세분화 및 마케팅 전략 기획서

고객 세분화 및 마케팅 전략 기획서 1. 개요 본 기획서는 데이터(brand_keyword_cnt.csv, product_info.csv, sales.csv, customer.csv)를 분석하여 고객 세분화와 마케팅 전략을 수립하는 데 목적이 있다. 2. 데이터

ojko.tistory.com

-다음글-

< BrandBoost-Analytics ( 고객 세분화 및 마케팅 전략 )> Clustering , 시계열 분석 (tistory.com)

 

< BrandBoost-Analytics ( 고객 세분화 및 마케팅 전략 )> Clustering , 시계열 분석

클러스터 0 ( 가장 높은 검색량 ) : 브랜드 'B002-02402'가 가장 높은 평균 검색량을 보였다. 클러스터 1 ( 평균적인 검색량 ) : 브랜드 'B002-01097'가 이 클러스터에서 가장 높은 평균 검색량을 보였다.

ojko.tistory.com