导图社区 数据分析
这是一篇关于数据分析的思维导图,分为提出问题&数据采集、数据整理、数据分析&可视化、数据结果呈现四个步骤。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
数据分析
1. 提出问题 & 数据采集
明确要分析的问题及分析的目的,选定所需的数据集并思考从当前数据集中要分析出什么业务数据后采集数据源并导出
2. 数据整理
CSV导入Excel
CSV格式文件占空间小,更易下载,可轻松导入Excel
数据格式整理
日期、数字格式:快捷键“ctrl+1“
文本
条件格式
标记重复值 or 标记符合特定条件的值
排序 / 筛选
Filter快捷键:“alt+D+F+F”,"alt+下箭头“;冻结窗格:“alt+W+F+F”
分列 / 删除重复值
数据关联
函数:VLOOKUP/ MATCH
3. 数据分析 & 可视化
数据透视表 Pivot + 切片器 = 动态图
Data Analysis
方差,移动平均,线性回归
4. 数据结果呈现
表格
选择性黏贴“alt+E+S”,一键求和“alt+”,跨列居中
图表, 迷你图
表格/图表 嵌入PPT
快捷键
常用函数
&,Len, Left/ Right,Find, Subsitute
统计/运算
SUMIF/COUNTIF/SUMIFS/COUNTIFS
Max/Min/Average/Subtotal/Rank
查询/引用:LOOKUP/MATCH
逻辑判断:IF/AND/OR/NOT
日期:Today()/Date/Day
其他:Hyperlink, IFERROR, ROUND
错误类型:#DIV/0!, #N/A, #REF!, #NAME?
&, Concatenate:连接字符串
Len:获取字符串的长度
Left/ Right: 从字符串中提取最左/右边的字符
Find:查找子字符串在字符串中的位置
Subsitute & Replace:用新文本替换字符串中现有文本知道要替换的文本时使用SUBSTITUTE;知道要替换的文本位置时使用Replace
Count/Sum:单元格计数/求和
Countif/Sumif:根据一个条件对单元格进行计数/求和
Countifs/Sumifs:根据多个条件对单元格进行计数/求和
查询/引用
VLookup/HLookup:垂直/水平查找
Match:返回给定范围内值的位置
逻辑
IF:检查条件是否满足,如果为真则返回一个值,为假则返回另一个值
And:如果所有条件为真,AND函数返回TRUE;如果任何条件为假,则返回FALSE
Or:如果任何一个条件为TRUE, 返回TRUE;如果所有条件为FALSE,则返回FALSE
Not:将TRUE改为FALSE, FALSE改为TRUE。
错误类型
#DIV/0! 0或空值做了除数
#N/A 无匹配值
#REF! 公式中有无效引用
#NAME? 文本未加双引号
其他
IFERROR
ROUND(UP/DOWN)
Hyperlink
日期Today()/Date/Day
数据分析 & 可视化
快速分析(ctrl+Q)
格式化
图表
汇总
迷你图
数据透视表
数据透视图
可视化数据透视表
切片器
动态图表
数据结果呈现
表格整理
图表展示
嵌入PPT
《深入浅出数据分析》
1. 分解数据
数据分析的基本流程
2. 检验你的理论
通过实验观察数据,理清因果关系
3. 寻找最优解/最大值
调整变量,找出解决方案和优化点
4. 数据图形化
摆脱“一叶障目,不见泰山”
5. 假设检验
评估假设,“证伪法”
6. 贝叶斯统计
利用基础概率和波动数据明察秋毫
7. 主观概率
信念数字化,利用标准偏差评估数据分布
8. 启发法
利用经验进行决策启发
9. 直方图
度量数据分布、差异、集中趋势
10. 回归预测
回归分析建立模型预测未来、预测客户行为
11. 合理误差
在预测中指出合理误差范围
12. 关系数据库
组织变化多端多维度变量的数据
13. 整理数据
让数据清楚地被看见
2.实验:检验你的理论
确定
了解/确定问题,发散思维
通过与客户沟通掌握真实意图
获取基准假设
(客户可能是你的老板亦或是你自己)
决策
除非将分析形成报告供制定决策否则分析将毫无用处
重组信息,形成分析报告:背景+数据说明+Insight/Recommendation
给出Insight
要以得到客户理解、鼓励客户以数据做出明智决策为重点
分解
分解问题:大化小
收集/分析数据:多维度比较
观察数据观点
评估
分析评估
结合基准假设和数据观察得出结论
数据分析Key:将原始数据转变成推动业务的锦囊妙策
随机控制实验
混杂因素:拆分数据块,管理混杂因素
控制组:一组体现现状的处理对象,未经任何新的处理
随机分组:一组体现现状的处理对象,未经任何新的处理
心智模型:你对外界的假设和确信的观点
你将运用的统计模型取决于你的心智模型
心智模型应包括你不了解的因素,“反查”(未雨绸缪方能防备不测风云)
分析最开始最好基于正确的假设建立模型
数据分析的永恒规律:回顾问题、提炼模型、基于新模型观察外界
将数据表划分成微区域
将微区域随机分配给控制组和实验组
控制组:维持现状
实验组1:变量1
收集结果
组与组相互比较,分析结果
实验组……:变量……
数据分析基本流程:
比较法
统计与分析最基本的原理之一
必须进行明确的比较,明确比较对象
比较维度越多,分析结果越正确
观察研究法
被研究的人自行决定自己属于哪个群体的一种研究方法
混杂因素:研究对象的个人差异
实验检验Key:确定因果关系,使分析判断更有说服力
实验程序