활용 Tool : MySQL, MySQL Workbench, Pandas, Excel, Tableau, Google Colab

기간 : 2024-02-23 ~ 2024-04-09

프로젝트 유형 : 개인 프로젝트

INDEX

0. SUMMARY

분석의 목적:

종합 분석 결과:

  1. 매출 변화 추세 분석:

  2. “그룹 B 카테고리”에 대한 요인 분석 결과:

이러한 분석 결과를 모두 고려할 때, 리뷰 점수, 제품 사진 수, 배송 기간과 같은 변수들이 매출에 부정적인 영향을 미치기는 하지만, 그 중요도가 1~4%로 현저히 낮아 이들 변수를 매출 정체의 주된 원인으로서 규명하기에 무리가 있습니다.

따라서 2018년 Olist의 매출 정체 세부 원인 도출에 있어서 분석에 활용된 Dataset 만으로는 한계가 존재할 것이라 생각됩니다.

전략 제안:

1. 분석 배경

1) 데이터 설명

사용한 데이터셋: Brazilian E-Commerce Public Dataset by Olist

Brazilian E-Commerce Public Dataset by Olist

데이터세트에는 2016년부터 2018년까지의 주문, 고객, 셀러, 리뷰 정보 등이 포함되어있음

2) 분석 배경

브라질 마켓은 중남미 이커머스 시장에서 약 30%에 가까운 점유율을 차지하고 있으며, 브라질 인구는 2억 1500만명으로 세계 7번째로 인구가 많은 국가임. 그 중에서 인터넷 사용자는 1억명 이상이며, 이커머스의 매출 78%가 플랫폼으로부터 발생하여 브라질 이커머스 플랫폼 시장은 무한한 가능성을 가지고 있을 것으로 판단됩니다.

Untitled

브라질의 이커머스 시장은 기회가 많은 만큼 경쟁 또한 치열하기에, 이러한 환경에서 Olist 플랫폼은 매출을 지속적으로 향상시킬 수 있는 전략이 절실합니다.

따라서, 본 데이터 분석 프로젝트는 Olist 플랫폼의 당면한 문제를 진단하고, 셀러의 매출 향상을 위한 실질적인 전략과 기회를 발굴하는 데 중점을 둘 것이고 이를 통해, Olist가 브라질 이커머스 시장에서의 성장 잠재력을 극대화할 수 있는 방안을 모색하고자 합니다.

2. 분석 목적

스크린샷 2024-04-07 16.44.46.png


3. 분석 결과

1) 전월 대비 2018년 세부 카테고리 별 매출 변화

스크린샷 2024-03-28 02.42.37.png

스크린샷 2024-04-18 17.13.50.png

기본적으로 두 카테고리의 트렌드 그래프 모두 월별 매출 변동이 크게 나타나는 것으로 확인.

전체 매출 대비 비중 80.63%를 차지하는, “그룹 B” 카테고리는 매출 합 추세선이 하향곡선을 그리고 있음.

반면에, “그룹 A” 카테고리 매출 합 추세선은 기울기는 낮지만 상향곡선을 그리고 있음.

결론

매출 정체에 실질적인 영향을 줄 가능성이 있는 카테고리는 “그룹 B" 카테고리로 확인


2) 2018년 그룹 B 카테고리의 매출 정체 원인에 대한 세부 분석

1. 독립변수 → 종속변수 영향도 측정(다중회귀분석)

2. 변수 중요도 평가(랜덤포레스트)