导图社区 统计与数据科学思维导图
下图为中级经济师基础知识考点笔记,统计与数据科学篇章的思维导图,供大家学习参考。
中级经济师第一章企业战略与经营决策笔记,包括企业战略概述、企业战略的分析、企业战略分类、企业经营决策四部分内容。
中级经济师 工商管理第5章节-生产管理
中级经济师:工商管理第3章节市场营销与品牌管理
社区模板帮助中心,点此进入>>
安全教育的重要性
个人日常活动安排思维导图
西游记主要人物性格分析
17种头脑风暴法
CPA战略风险管理、战略实施
如何令自己更快乐
头脑风暴法四个原则
思维导图
第二职业规划书
substantive procedures
统计与数据科学
定义
统计学是关于收集、整理、分析、结论的科学
分类
描述统计
推断统计
定义:利用样本数据推断总体特征
参数估计
利用样本信息推断总体特征
假设检验
利用样本信息判断对总体的假设是否成立
变量与数据
变量
研究对象的属性或特征
定量变量
定性变量
分类变量
比如企业所属行业
顺序变量
比如教育程度
变量间的关系
相关程度
完全相关
不相关
不完全相关
相关形式
线性
非线性
相关方向
正相关
负相关
散点图
Pearson相关系数
取值范围
(0,1],正相关(1为正线性先关)
[-1,0),负相关(-1为负线性相关)
0,不线性先关
判断
正负0.8以上,高度相关
正负0.5到0.8,中毒相关
正负0.3-0.5,低度相关
正负<0.3,极弱相关
数据
是对变量的测量或观测的结果
分类数据
对分类变量的观测结果
顺序数据
对顺序变量的观测结果
来源
收集方式
观测数据
实验数据
本身来源
一手数据
二手数据
分布特征
集中趋势
反映数据向中心值聚拢的程度
指标
均值
算数平均数
适用于定量变量
中位数
中间顺序的值
适用于顺序变量和定量变量
众数
出现次数最多的
适用于分类变量和顺序变量
离散程度
反映数据之间的差异程度,也能反映中心值对数据的代表程度
方差
各数据与均值的差值绝对值平方的累计和的平均数
标准差
方差的平方根
离散系数
标准差与均值的比值
分布偏态
反映数据的不对称性
偏态系数
公式不用记
SK取值范围
0:数据对称
0-0.5(或-0.5-0):数据偏右(左)
0.5-1(或-1至-0.5):中毒偏右(左)
>1:严重偏右(左)
标准分数
对于服从对称(钟型)分布的标准分数
68%的在[-1,1]
95%的在[-2,2]
99%的在[-3,3]
统计调查
定义:按照既定目标和任务,收集数据的过程
按调查对象的范围
全面调查
定义:全部调查对象
全面统计报表
普查
人口
十年一次,逢0
经济
十年两次,逢3、8
农业
十年一次,逢6
非全面调查
定义:对调查对象汇总的一部分单位进行调查
非全面统计报表
抽样调查
概念
总体、样本、抽样框、抽样单元、总体参数、样本统计量
概率抽样
简单随机抽样
分层抽样
系统抽样
整群抽样
多阶段抽样
非概率抽样
主观意识判断抽样方法
判断抽样
方便抽样
自愿抽样
配额抽样
误差
抽样误差
非抽样误差
抽样框误差
无回答误差
计量误差
重点调查
典型调查
按调查登记时间是否连续
连续调查
不连续调查
大数据
4V特性
数据量大
数据多样性
价值密度低
数据的产生和处理速度快
数据挖掘
有指导学习或监督学习
无指导学习或非监督学习
数据可视化
科学可视化
信息可视化