楼主 wise |
开场白:(注:本贴的所有数据均是虚拟的,并非真实数据,不涉及泄密。) 无论是Excel还是Access,对于分析师而言,都是一个必须掌握的工具。 不知不觉从事了数据分析、数据挖掘方面的工作已经5年多了,每天除了写PPT外,就是和Excel、Access、Oracle等数据处理工具接触最多了。从基于Excel的几百行数据到Access里面的几百万行数据,再到Oracle里面的几千万行数据,也处理了很多,咨询报告也写了不少,在公司里面培训Excel、Access也不少了。本人是一个不折不扣的与数据打交道,并赤身搏杀的数据控。也应该写点东西给社区的朋友去分享一下。 有人说:“我学会了Excel,我就可以当数据分析师了么?” 有人也问我:“这次人家传了300M的数据给我,我不知道如何处理啊,能否教一下我?” 有人看到了200多M的数据,坑爹的,这不是为难我么?这么大的数据,怎么处理呢? ......... 遇到了太多这样的事情了,也指导了很多人处理大数据,因为本人喜欢偷懒,嘴巴有点臭,说的话难听,但却是真实的反映,对那些喜欢的人说声谢谢,对那些不喜欢我的人说声也谢谢你讨厌我。 对了,精通excel或access不等于会数据分析了。 废话不多说,正式带进大家使用Access玩转数据分析。 PS:本贴作为一个Access与数据分析处理的学习贴,不欢迎回复,若回复,请去咖啡室去说几句我,其他均删除回复帖,直到写完相应的过程。 入门第1招:文本数据导入 经常客户递交过来的数据都是用txt、csv文本格式的,要会数据分析,必须会导入数据,并且需要导入到Access里面。 请看如何将txt数据导入到Access里面,注意设置相应字段格式(如文本、数字、日期,演示中有相应演示)。 常见的txt文档: 导入演示: 数据源.rar |
2楼 wise |
入门第2招:学会Access查询 select语句估计大家都懂一点,在数据分析中,查询语句居大部分,通过查询,能够得到符合的数据。下面请看如何在Access里面进行查询操作: 例如需要查询“地市、付费类型、套餐名称、手机上网使用流量(M)、ARPU ”等数据,在Access里面如何实现的呢? 请看演示(数据均是模拟虚构) 查询是每个数据分析师必须掌握的最基本操作。 |
3楼 wise |
入门第3招:学会Access查询中添加条件 有时候,数据分析取决于需求,客户会出一些他想要的东西,根据客户的需求,取出相应条件的数据。 如:我想知道深圳、广州这两个城市的清单列表,你马上给我输出来。必须半个小时我就要把这些清单下发给分公司了。 听到这个需求,其实客户的要求很简单,就是需要取出“广州、深圳”两个地市的清单。 那在本例中如何操作呢? 其实不需要写啥代码,只需要会一点点操作,就可以输出相应的清单了。 下面请查看操作: |
4楼 wise |
入门第4招:学会Access分组汇总 “兄弟啊!辛苦你了,清单已经下发了,麻烦你把广州、深圳两个地市的手机上网流量均值、ARPU均值、手机上网时长均值统计出来给我。” 客户的需求就像催命符,一个接一个,一直把你的身心和肉体上都受尽折磨。 其实汇总也是很简单,需要select ...group by进行分组即可。 但是在大数据分析中,分组统计是常常用到的。 下面请看如何快速进行分组汇总: |
5楼 wise |
入门第5招:学会Access进行文本统计个数 “我想看看用户用哪些手机终端型号,需要做下一步终端内容推荐。” 简单的一句话,就知道客户的需求是需要对终端型号进行个数统计,看看哪些是用户量比较大的手机终端。 主要通过:select 终端型号,count(终端型号) from 数据源 group by 终端型号 order by count(终端型号) desc 其演示操作却不需要写代码: 说明了:了解用户需求很重要,一句话,即可有数据支撑。 |
6楼 wise |
入门第6招:学会Access进行求TOP “兄弟啊,你的终端类型数据是出来了,但我不并不关注这么多终端啊,领导只需要关注前10个用户数最大的终端,你快点帮我做出来。” “什么?前10个用户数最大的终端?好的,我马上去做,你等等。” 对于数据分析师而言,客户一般都需要根据你统计分析的结果用到营销中,根据二八法则来看,只需要集中关注用户基数最大,并且能够覆盖80%左右的用户的终端即可。 在数据分析中,常常会有求排名前10的用户。 其SQL语句是: Select Top 10 终端类型,Count(终端类型) as 数量 from 数据源 group by 终端类型 order by count(终端类型) desc 在Access里面,这个实现也比较简单,就使用Top 10进行实现,只需要修改一下代码即可,具体演示请看: |
7楼 wise |
入门第7招:学会Access剔除异常数据并分组汇总 “兄弟啊,我提取给你的这份数据,如果出现ARPU值为负数的,可能是因为其他原因的计算导致错误的,因为ARPU值不可能为负数的。你剔除异常值,分别把各地市的ARPU均值统计一遍,并进行排序。” “什么?ARPU值里面出现负数的?不是吧。”这个时候你心里是这样想的,但作为一个分析师,千万不要这样说,需要发现异常数据并剔除异常数据是你的本份,不要等着客户发现问题,应该是你发现问题并提前咨询客户的意见。 在这里其实是客户发现了问题,这个数据分析师不称职了。其实剔除异常数据再分组汇总也很简单。 注意:是先选出ARPU大于0的数据,再进行统计分析 其演示如下: |
8楼 涅磐86970 |
楼主是咨询公司的?还是通信行业的呀? 看到套餐、ARPU值之类的好有亲切感 哈哈 顺便问下问题哈:我对excel、access、sql sever基本都有一定的了解,也都做过一些数据分析。但感觉自己的水平总是流离于操作工 |
9楼 涅磐86970 |
我是通信设备商的 所以也会给运营商做咨询,主要是网络,顺便做点业务。但其实都不怎么专业。 还是希望楼主指点下:感觉自己的水平总是流离于操作工,应在在哪方面进行下提高?统计学?~~~~~~~~~非常感谢 |
10楼 飞虎 |
最近在学习谢谢了 |
11楼 weikang2516 |
受教了,谢谢LZ, |
12楼 大江东去 |
学习无止境 |
13楼 weikang2516 |
跟进学习,谢谢楼主 |
14楼 jwang1214 |
|
15楼 bravekid |
好帖子 |