数据分析案例:使用pandas进行自行车销售记录的数据分析+数据分析报告,看不懂你打我(附源码)使用pandas进行自行车销售记录的数据分析,看不懂你打我数据分析报告

阅读: 评论:0

数据分析案例:使用pandas进行自行车销售记录的数据分析+数据分析报告,看不懂你打我(附源码)使用pandas进行自行车销售记录的数据分析,看不懂你打我数据分析报告

数据分析案例:使用pandas进行自行车销售记录的数据分析+数据分析报告,看不懂你打我(附源码)使用pandas进行自行车销售记录的数据分析,看不懂你打我数据分析报告

使用pandas进行自行车销售记录的数据分析,看不懂你打我

本文数据和源代码见github:
bicycle-sales-record-based-on-pandas.git

文章目录

  • 使用pandas进行自行车销售记录的数据分析,看不懂你打我
  • * 原始数据 
    
    • 详细数据分析过程
    •   * 思路 
      
    • 代码
  • 数据分析报告
  • * 1. 商品的种类和商品的总销售数量; 
    
      1. 总销售次数,月份数,月均销售次数;
      1. 总销售金额,平均每月销售金额,平均每单销售金额;
      1. 最大和最小日销售金额及对应的日期、最大和最小日销售数量及对应的日期;
      1. 各个月单独的每日销售金额直方图

原始数据

![在这里插入图片描述](.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM1NDU2MDQ1,size_16,color_FFFFFF,t_70)

详细数据分析过程

思路

  • 导入数据集;

  • 检查数据基本属性;

  • 修改个别表头、舍弃缺失的不完整数据行;

  • 对时间这一列信息进行特殊处理,舍弃星期的信息,然后将时间这一列数据的格式转为时间格式pd.to_datetime();

  • “销售数量”、“应收金额”、“实收金额”这三列数据显然不可能有负数,我们要舍弃掉一些异常值的数据行;

  • 对数据按时间升序排序,重置其索引;

  • 计算商品的种类和商品的总销售数量;

  • 计算总销售次数,月份数,月均销售次数;

  • 计算总销售金额,平均每月销售金额,平均每单销售金额;

  • 计算最大和最小日销售金额及对应的日期、最大和最小日销售数量及对应的日期;

  • 画出各个月单独的每日销售金额直方图、每月销售金额直方图、每月销售金额变化直线图、销量前十和最后十名的自行车的直方图。

  • 代码实现

代码

    import osimport matplotlib.pyplot as pltimport pandas as pdfrom pylab import mpl  # 用于画图时显示中文字符
    Params['font.sans-serif'] = ['SimHei']  # 使用matplotlib画图时如果出现中文使用黑体字体file_data = pd.read_excel("销售记录.xlsx")  # 读取数据文件
    file_data

![在这里插入图片描述](.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM1NDU2MDQ1,size_16,color_FFFFFF,t_70)

    # 获取文件名def get_file_name(fl_data):# items()函数以列表返回可遍历的(键, 值)元组数组# globals()是一个字典,存储了所有的全局变量的名字和对应的变量的值# 在这里我们通过判断输入的变量的值与globals()中存储的变量的值是否相等,相等就认为我们输入的变量就是这个globals()中存储的变量# 这样我们就返回这个globals()中存储的变量的变量名,即keyfor var_name, value in globals().items():if value is fl_data:return var_name
    # 显示读入的文件数据的一些基本属性def show_data_basic_description(fl_data):describe_label_shape = get_file_name(file_data) + "文件的shape大小:"print(describe_label_shape, file_data.shape)describe_label_index = get_file_name(file_data) + "文件的索引开头和末尾:"print(describe_label_index, file_data.index)describe_label_table_head = get_file_name(file_data) + "文件的表头项:"print(describe_label_table_head, lumns)describe_label_top_five_line = get_file_name(file_data) + "文件的内容:n"print(describe_label_top_five_line, file_data.head())describe_label_data_type = get_file_name(file_data) + "文件的各项的数据类型:n"print(describe_label_data_type, file_data.dtypes)
    print("文件预处理前的各项属性:")show_data_basic_description(file_data)# 其中一个列的表头重命名一下ame(columns={"下单日期": "销售时间"}, inplace=True)

![在这里插入图片描述](.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM1NDU2MDQ1,size_16,color_FFFFFF,t_70)

    # 删除所有有缺失数据的行file_data = file_data.dropna(subset=['订单编号', '客户ID', '客户名称', '客户编号', '客户省份', '销售代表ID', '销售时间', '预计送货日期', '实际送货日期', '产品ID', '产品名称', '数量', '单价', '金额'], how="any")file_data

![在这里插入图片描述](.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM1NDU2MDQ1,size_16,color_FFFFFF,t_70)

    # 删除无效时间的数据,没有file_data = file_data.dropna(subset=["销售时间"], how="any")file_data

![在这里插入图片描述](.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM1NDU2MDQ1,size_16,color_FFFFFF,t_70)

    # 处理异常值:“数量”、“单价”、“金额”这三列数据显然不可能有负数,因此要去掉不合理的数据pop = file_data.loc[:, "金额"] > 0file_data = file_data.loc[pop, :]file_data

![在这里插入图片描述](https:/

本文发布于:2024-01-29 18:23:08,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170652379217393.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   看不   打我   分析报告   懂你
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23