下篇指路:
本项目是来自kaggle上的数据集案例,记录了巴西电商平台Olist 2016,2018的真实业务数据数据,包含以下的内容。
1.通过用户,商家,产品,销售四个维度分析该平台的总体经营状况和所处阶段
2.发现平台存在的问题,分析原因,给出相应的建议
3.对于异常指标的变化,分析原因
4.对未来的工作给出总体方向,目标和合理化建议
主要通过用户,商家,产品,销售四个维度来展开分析各项指标。
使用到的工具主要有python,excel,tableau等
主要分析的方向有用户的地区分布,用户支付方式,分期偏好,下单时间等行为偏好,以及基于RFM模型将用户进行分层
数据导入处理
import numpy as np
import pandas as pd
ad_csv('olist_order_payments_dataset.csv')
ad_csv('olist_customers_dataset.csv')
ad_csv('olist_orders_dataset.csv')
orders.isnull().sum()
payments.isnull().sum()
customers.isnull().sum() #缺失值查看
由于缺失值仅在order_approved_at,order_delivered_carrier_date,order_delivered_customer_date这三个列出现,而这三列与我们分析工作关系不大,所以可以忽略。
(payments,orders,how='left',on='order_id')
(po,customers,how='left',on='customer_id')#数据合并
state=pd.DataFrame(pc['customer_unique_id'].groupby([pc['customer_state']]).count())
#用户地区分布
该平台的用户大多数来自于SP比例高达42%,其次是RJ和MG。这可能与巴西人口密度分布有关,当然也与平台在其他地区程度的普及程度,当地人购物方式有着很大的关系。
p_type_c=pd.DataFrame(pc['customer_unique_id'].groupby([pc['payment_type'],pc['customer_state']]).
本文发布于:2024-02-02 14:28:24,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170685530344414.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |