활용 Tool : MySQL, MySQL Workbench, Pandas, Excel, Tableau, Google Colab
기간 : 2024-02-23 ~ 2024-04-09
프로젝트 유형 : 개인 프로젝트
INDEX
0. SUMMARY
분석의 목적:
- Olist의 매출이 2018년도 초입을 기점으로 정체하는 원인 규명
- 제품, 주문정보, 매출 등의 요인 분석을 통해 인사이트 도출 및 이를 적용한 전략을 Olist 입점 셀러에게 제안
종합 분석 결과:
- 매출 정체에 실질적인 영향을 줄 가능성이 있는 카테고리는 “그룹 B 카테고리”(매출 비중 80.63%)로 확인
- 매출 정체의 주요 원인이 데이터세트 내에 존재하지 않을 가능성이 높음
-
매출 변화 추세 분석:
- 월별 매출합 변화
- 2018년 “그룹 B 카테고리”(매출 비중 80.63%)에서는 월별 매출 합이 하락 추세를 보였지만 “그룹 A 카테고리”(매출 비중:19.37%)에서는 월별 매출합이 상승 추세를 보였습니다.
- **매출 비중의 편중
- “매출이 일부 특정 카테고리에 편중되어 있음”**을 확인할 수 있었습니다.
- 2018년 매출 정체의 주요 요인
- 2018년 매출 정체의 실질적 원인이 “그룹 B 카테고리”의 내부 변수와 인과관계를 지닐 가능성이 존재할 수 있음을 추론할 수 있었습니다.
- 2018년 그룹 A, B 카테고리
-
“그룹 B 카테고리”에 대한 요인 분석 결과:
- “그룹 B 카테고리”의 매출 정체 원인을 규명하기 위한 다중회귀분석 및 랜덤포레스트 변수 중요도 평가를 통해 하기 내용을 파악했습니다.
- 매출에 긍정적인 영향을 미치는 변수: 가격, 운임 비용, 결제 할부 수, 제품 설명 길이, 배송 지연이 매출 증대에 중요한 역할을 했습니다.
특히 가격은 이들 중에서도 가장 높은 중요도(약 68%)를 가진 변수로 나타나, 매출에 결정적인 영향을 미쳤습니다.
- 매출에 부정적인 영향을 미치는 변수: 리뷰 점수, 제품 사진 수, 배송 기간이 매출 감소와 관련되었으나,
이들 변수의 중요도는 1 ~ 4% 사이로 매우 낮게 평가되었습니다.
이러한 분석 결과를 모두 고려할 때, 리뷰 점수, 제품 사진 수, 배송 기간과 같은 변수들이 매출에 부정적인 영향을 미치기는 하지만,
그 중요도가 1~4%로 현저히 낮아 이들 변수를 매출 정체의 주된 원인으로서 규명하기에 무리가 있습니다.
따라서 2018년 Olist의 매출 정체 세부 원인 도출에 있어서 분석에 활용된 Dataset 만으로는 한계가 존재할 것이라 생각됩니다.
전략 제안:
- 주요 카테고리에 과도하게 의존하는 매출 구조를 개선하기 위해, 매출 비중이 낮은 기타 카테고리에 대한 마케팅 강화를 추천합니다.
- 매출 정체의 세부 원인 발굴을 위해 2018년 당시의 브라질 경제 상황 및 경쟁사 상황 등 외부 요인이 고려된 심층 분석이 필요합니다.
1. 분석 배경
1) 데이터 설명
사용한 데이터셋: Brazilian E-Commerce Public Dataset by Olist
Brazilian E-Commerce Public Dataset by Olist
데이터세트에는 2016년부터 2018년까지의 주문, 고객, 셀러, 리뷰 정보 등이 포함되어있음
2) 분석 배경
브라질 마켓은 중남미 이커머스 시장에서 약 30%에 가까운 점유율을 차지하고 있으며, 브라질 인구는 2억 1500만명으로 세계 7번째로 인구가 많은 국가임. 그 중에서 인터넷 사용자는 1억명 이상이며, 이커머스의 매출 78%가 플랫폼으로부터 발생하여 브라질 이커머스 플랫폼 시장은 무한한 가능성을 가지고 있을 것으로 판단됩니다.
브라질의 이커머스 시장은 기회가 많은 만큼 경쟁 또한 치열하기에, 이러한 환경에서 Olist 플랫폼은 매출을 지속적으로 향상시킬 수 있는 전략이 절실합니다.
따라서, 본 데이터 분석 프로젝트는 Olist 플랫폼의 당면한 문제를 진단하고, 셀러의 매출 향상을 위한 실질적인 전략과 기회를 발굴하는 데 중점을 둘 것이고
이를 통해, Olist가 브라질 이커머스 시장에서의 성장 잠재력을 극대화할 수 있는 방안을 모색하고자 합니다.
2. 분석 목적
- 2018년 Olist의 매출의 정체 원인 규명
- 제품,주문정보,매출 등의 요인 분석을 통해 ”인사이트 도출 및 이를 적용한 전략 ”을 Olist 입점 셀러에게 제안
- query
3. 분석 결과
1) 전월 대비 2018년 세부 카테고리 별 매출 변화
- 2018년의 카테고리 중 매출 성장의 정체기에 기여도가 높은 카테고리를 식별할 수 있을 것이다” 가정하고
2018년 전월 대비 매출 변화 및 매출 비중 분석 진행
- 2018년의 세부 카테고리 별, 전월 대비 매출 변화율 분석 (1월의 전월대비 매출 변화율은 계산에서 제외함)
- 전월 대비 매출 변화율이 100% 이상일 때, 초록색 음영, 0% 미만일 때, 붉은색 음영 표시
- 데이터 해석 예시 → 0.88: 전월 대비 88%의 매출 증가, -0.14: 전월 대비 14%의 매출 감소
-
전체 매출 비중의 1.76% 이상인 카테고리를 기준 설정한 근거
-
code
-
2018년 1월부터 8월까지의 매출 트렌드를 정량적으로 파악하고자,
”그룹 B” 카테고리와 “그룹 A” 카테고리의 매출 합에 대한 월별 트렌드 분석 진행
기본적으로 두 카테고리의 트렌드 그래프 모두 월별 매출 변동이 크게 나타나는 것으로 확인.
전체 매출 대비 비중 80.63%를 차지하는, “그룹 B” 카테고리는 매출 합 추세선이 하향곡선을 그리고 있음.
반면에, “그룹 A” 카테고리 매출 합 추세선은 기울기는 낮지만 상향곡선을 그리고 있음.
결론
매출 정체에 실질적인 영향을 줄 가능성이 있는 카테고리는 “그룹 B" 카테고리로 확인
2) 2018년 그룹 B 카테고리의 매출 정체 원인에 대한 세부 분석
1. 독립변수 → 종속변수 영향도 측정(다중회귀분석)
2. 변수 중요도 평가(랜덤포레스트)