Osheep

时光不回头,当下最重要。

大数据入门篇-朝阳医院2016年销售数据分析

《大数据入门篇-朝阳医院2016年销售数据分析》

朝阳医院2016年销售数据分析

本关学习内容:R语言第三章(知识点链接https://zhuanlan.zhihu.com/p/28610253)和第四章(知识点链接https://zhuanlan.zhihu.com/p/28610422),简单的数据处理和分析

实践项目:根据朝阳医院2016年销售数据.xlsx分析月均消费次数,月均消费金额,客单价,消费趋势。

实践项目的:学习和使用简单的数据处理和分析,巩固和实践所学的内容,加深理解简单处理数据处理和分析的过程。

做此项目的大致流程:读取excel数据(选用openxlsx来读取)->数据预处理->数据分析;其中数据预处理包括了列名重命名,删除缺失数据,处理日期,数据类型转换,数据排序等相关知识。

下面我们就来做此项目吧!

朝阳医院2016年销售数据.xlsx部分内容如下:

《大数据入门篇-朝阳医院2016年销售数据分析》

一:读取excel数据

1.下载安装openxlsx包和stringr包(R语言的字符串处理包)

《大数据入门篇-朝阳医院2016年销售数据分析》

2.读取excel数据

《大数据入门篇-朝阳医院2016年销售数据分析》

二:数据预处理

《大数据入门篇-朝阳医院2016年销售数据分析》

列名重命名后:

《大数据入门篇-朝阳医院2016年销售数据分析》

三:数据分析:

业务指标1:月均消费次数

月消费次数=消费的总次数/月数

注意:同一天同一个人购买所有消费次数当算作消费一次。

本例子以社保卡号和消费时间为切入点

《大数据入门篇-朝阳医院2016年销售数据分析》

结果如下:

《大数据入门篇-朝阳医院2016年销售数据分析》

《大数据入门篇-朝阳医院2016年销售数据分析》

业务指标2:月均消费金额

月均消费金额=总消费金额/月份数

《大数据入门篇-朝阳医院2016年销售数据分析》

《大数据入门篇-朝阳医院2016年销售数据分析》

业务指标3:客单价pct(per customer transaction)

客单价=总消费金额/总消费次数

《大数据入门篇-朝阳医院2016年销售数据分析》

业务指标4:消费曲线图

《大数据入门篇-朝阳医院2016年销售数据分析》

本关心得:多敲代码,多练习,多做项目,才会让基础更扎实!

                                                                                                                              十三西游记(公众号十三西游记) 

                                                                                                                                                     2017/08/18记

点赞