ExcelTip.Net留存知识帖 ---【注:附件之前被网盘供应商清空后,现已修复-现已修复-现已修复为本地下载!】
现在位置:首页 > 我的酷贴 > Access > 数据分析与数据处理_Access篇

数据分析与数据处理_Access篇

作者:绿色风 分类: 时间:2022-08-18 浏览:108
楼主
wise
开场白:(注:本贴的所有数据均是虚拟的,并非真实数据,不涉及泄密。)
无论是Excel还是Access,对于分析师而言,都是一个必须掌握的工具。
不知不觉从事了数据分析、数据挖掘方面的工作已经5年多了,每天除了写PPT外,就是和Excel、Access、Oracle等数据处理工具接触最多了。从基于Excel的几百行数据到Access里面的几百万行数据,再到Oracle里面的几千万行数据,也处理了很多,咨询报告也写了不少,在公司里面培训Excel、Access也不少了。本人是一个不折不扣的与数据打交道,并赤身搏杀的数据控。也应该写点东西给社区的朋友去分享一下。
有人说:“我学会了Excel,我就可以当数据分析师了么?”
有人也问我:“这次人家传了300M的数据给我,我不知道如何处理啊,能否教一下我?”
有人看到了200多M的数据,坑爹的,这不是为难我么?这么大的数据,怎么处理呢?
.........
遇到了太多这样的事情了,也指导了很多人处理大数据,因为本人喜欢偷懒,嘴巴有点臭,说的话难听,但却是真实的反映,对那些喜欢的人说声谢谢,对那些不喜欢我的人说声也谢谢你讨厌我。
对了,精通excel或access不等于会数据分析了。
废话不多说,正式带进大家使用Access玩转数据分析。
PS:本贴作为一个Access与数据分析处理的学习贴,不欢迎回复,若回复,请去咖啡室去说几句我,其他均删除回复帖,直到写完相应的过程。

入门第1招:文本数据导入
经常客户递交过来的数据都是用txt、csv文本格式的,要会数据分析,必须会导入数据,并且需要导入到Access里面。
请看如何将txt数据导入到Access里面,注意设置相应字段格式(如文本、数字、日期,演示中有相应演示)。
常见的txt文档:

 
导入演示:

 

数据源.rar
2楼
wise
入门第2招:学会Access查询
select语句估计大家都懂一点,在数据分析中,查询语句居大部分,通过查询,能够得到符合的数据。下面请看如何在Access里面进行查询操作:
例如需要查询“地市、付费类型、套餐名称、手机上网使用流量(M)、ARPU ”等数据,在Access里面如何实现的呢?
请看演示(数据均是模拟虚构)

 
查询是每个数据分析师必须掌握的最基本操作。
3楼
wise
入门第3招:学会Access查询中添加条件
有时候,数据分析取决于需求,客户会出一些他想要的东西,根据客户的需求,取出相应条件的数据。
如:我想知道深圳、广州这两个城市的清单列表,你马上给我输出来。必须半个小时我就要把这些清单下发给分公司了。
听到这个需求,其实客户的要求很简单,就是需要取出“广州、深圳”两个地市的清单。
那在本例中如何操作呢?
其实不需要写啥代码,只需要会一点点操作,就可以输出相应的清单了。
下面请查看操作:

 
4楼
wise
入门第4招:学会Access分组汇总
“兄弟啊!辛苦你了,清单已经下发了,麻烦你把广州、深圳两个地市的手机上网流量均值、ARPU均值、手机上网时长均值统计出来给我。”
客户的需求就像催命符,一个接一个,一直把你的身心和肉体上都受尽折磨。
其实汇总也是很简单,需要select ...group by进行分组即可。
但是在大数据分析中,分组统计是常常用到的。
下面请看如何快速进行分组汇总:

 
5楼
wise
入门第5招:学会Access进行文本统计个数
“我想看看用户用哪些手机终端型号,需要做下一步终端内容推荐。”
简单的一句话,就知道客户的需求是需要对终端型号进行个数统计,看看哪些是用户量比较大的手机终端。
主要通过:select 终端型号,count(终端型号) from 数据源 group by 终端型号 order by count(终端型号) desc
其演示操作却不需要写代码:

 

说明了:了解用户需求很重要,一句话,即可有数据支撑。
6楼
wise
入门第6招:学会Access进行求TOP
“兄弟啊,你的终端类型数据是出来了,但我不并不关注这么多终端啊,领导只需要关注前10个用户数最大的终端,你快点帮我做出来。”
“什么?前10个用户数最大的终端?好的,我马上去做,你等等。”
对于数据分析师而言,客户一般都需要根据你统计分析的结果用到营销中,根据二八法则来看,只需要集中关注用户基数最大,并且能够覆盖80%左右的用户的终端即可。
在数据分析中,常常会有求排名前10的用户。
其SQL语句是: Select Top 10 终端类型,Count(终端类型) as 数量 from 数据源 group by  终端类型 order by count(终端类型) desc
在Access里面,这个实现也比较简单,就使用Top 10进行实现,只需要修改一下代码即可,具体演示请看:

 

7楼
wise
入门第7招:学会Access剔除异常数据并分组汇总
“兄弟啊,我提取给你的这份数据,如果出现ARPU值为负数的,可能是因为其他原因的计算导致错误的,因为ARPU值不可能为负数的。你剔除异常值,分别把各地市的ARPU均值统计一遍,并进行排序。”
“什么?ARPU值里面出现负数的?不是吧。”这个时候你心里是这样想的,但作为一个分析师,千万不要这样说,需要发现异常数据并剔除异常数据是你的本份,不要等着客户发现问题,应该是你发现问题并提前咨询客户的意见。
在这里其实是客户发现了问题,这个数据分析师不称职了。
其实剔除异常数据再分组汇总也很简单。
注意:是先选出ARPU大于0的数据,再进行统计分析
其演示如下:

 
8楼
涅磐86970
楼主是咨询公司的?还是通信行业的呀?
看到套餐、ARPU值之类的好有亲切感 哈哈
顺便问下问题哈:我对excel、access、sql sever基本都有一定的了解,也都做过一些数据分析。但感觉自己的水平总是流离于操作工
9楼
涅磐86970
我是通信设备商的 所以也会给运营商做咨询,主要是网络,顺便做点业务。但其实都不怎么专业。
还是希望楼主指点下:感觉自己的水平总是流离于操作工,应在在哪方面进行下提高?统计学?~~~~~~~~~非常感谢
10楼
飞虎
最近在学习谢谢了
11楼
weikang2516
受教了,谢谢LZ,
12楼
大江东去
学习无止境
13楼
weikang2516
跟进学习,谢谢楼主
14楼
jwang1214
15楼
bravekid
好帖子

免责声明

有感于原ExcelTip.Net留存知识的价值及部分知识具有的时间限定性因素, 经与ExcelTip.Net站长Apolloh商议并征得其同意, 现将原属ExcelTip.Net的知识帖采集资料于本站点进行展示, 供有需要的人士查询使用,也慰缅曾经的论坛时代。 所示各个帖子的原作者如对版权有异议, 可与本人沟通提出,或于本站点留言,我们会尽快处理。 在此,感谢ExcelTip.Net站长Apolloh的支持,感谢本站点所有人**绿色风(QQ:79664738)**的支持与奉献,特此鸣谢!
------本人网名**KevinChengCW(QQ:1210618015)**原ExcelTip.Net总版主之一

评论列表
sitemap