导图社区 第四部分 统计思维导图
这是一篇关于第四部分 统计思维导图,包含集中趋势的测度、离散程度的测度、变量间的相关分析等
编辑于2023-11-07 09:26:55第四部分 统计
第二十三章 统计与数据科学
第二十四章 描述统计
第二十五章 抽样调查
第二十六章 回归分析
第二十七章 时间序列分析
第二十三章统计与统计数据(4-5分)
第一节 统计学
【知识点1】两大分支
描述
推断
参数估计
样本
总体
假设检验
样本
总计假设是否成立
第二节 变量与数据
变量
定量
定性
分类
顺序
数据
定量
数值型
定性
分类
顺序
第三节 数据来源
按收集方法
观测
经济数据
实验
从使用者的角度看,按来源分类
一手
二手
第四节统计调查
【知识点一】分类
调查对象的范围
全面
全面统计表
普查
非全面
非全面统计报表
抽样
重点
典型
调查登记的时间是否连续
连续
不连续
报送周期长短
日
月
季
年
报表内容实施范围
国家
部门
地方
【知识点二】方式
统计报表
普查
抽样
重点
比重大
典型
有代表性
调查
【知识点三】统计质量评价标准
真实
准确
误差在控制范围内
完整
及时
适用
经济
可比
协调
可获得
第五节数据科学与大数据
数据科学
大数据
特性
数据量大
多样性
价值密度低
产生
处理速度
快
数据挖掘
监督
非监督
半监督
学习
数据可视化
第二十四章描述统计(5-6分)
第一节集中趋势的测度
【知识点一】均值
最主要
特点
影响
极端值
使用范围
数值型数据
【知识点二】中位数
定义
最中间数
从小到大排
特点
不受影响
极端值
抗干扰性强
适用于
收入
使用范围
顺序
数值
【知识点三】众数
定义
频次最多
特点
集中趋势
难以描述
使用范围
顺序
分类
第二节离散程度的测度
方差
使用范围
数值型
特点
影响
极端值
标准差
使用范围
特点
离散系数
含义:标准值/均值
第三节分布形态的测度
【知识点一】分布形态的测度指标
包括
偏态系数
定义
离差三次方的平均数/标准差三次方
=0
对称
>0
右偏
<0
左偏
说明
0~0.5
轻度
0.5~1
中度
>1
严重
标准分数
计算
(原始值-均值)/标准差
作用
相对位置
距离均值
应用
服从正态分布时(168,295,399)
68%在【-1,1】
95%在【-2,2】
99%在【-3,3】
第四节变量间的相关分析
【知识点一】相关关系
程度
完全
不完全
不相关
方向
正
负
形式
线性
非线性
【知识点二】两变量的散点图
展示
相关关系
【知识点三】相关系数的定义和取值
范围
【-1,1】
只适用于线性相关
0<R≤1
正
R=1
完全
-1≤R<0
负
R=-1
完全
R=0
不存在线性相关
相关程度
r≥0.8
高度
0.5≤R<0.8
中度
0.3≤R<0.5
低度
r<0.3
无线性相关
总结
各变量的使用
数值型
均值
中位数
方差
标准差
极端值
标准分数
顺序
众数
中位数
分类
众数
数据分布特征的测度
集中趋势
向中心值的聚集程度
离散程度
数据的差异性
中心数据的代表程度
偏态
不对称性
系数
相关
决定
偏态
第二十五章抽样调查(5-6分)
第一节基本概念
【知识点一】基本概念
总体
样本和样本量
影响样本量的因素
调查精度
总体
离散程度
规模
无回答情况
经费的制约
抽样框
总体参数
样本统计量
估计量
【知识点二】概率抽样和非概率抽样
概率抽样
非概率抽样
【知识点三】一般步骤
【知识点四】误差
抽样框
无回答
①随机因素
被调查者恰巧不在
②非随机因素
拒绝回答
计量
调查人员
问卷设计
受访者
优点
适应面广
时效性强
准确性高
经济性
工作量小
最显著
第二节几种基本概率抽样方法
【知识点一】简单随机
分类
1、有放回
2、不放回
优点:
操作简单
缺点
辅助信息
抽样框
没有利用
适用条件
范围广
差异不大
【知识点二】分层
分配方法
等比例
不等比例
优点
1.估计参数
总体
各层
2.便于组织。
抽样工作
3.降低误差。
每层抽取
样本分布均匀
适用条件
层
内
差异小
间
差异大
【知识点三】系统
定义
顺序排列
等间距抽样
最简单
(二)优缺点
1、优点
(1)操作简便;
(2)抽样框
要求简单
估计效果
总体排序
2、缺点
方差估计复杂
计算困难
抽样误差
【知识点四】整群
适用条件
组
间
差异小
内
差异大
特殊群结构
多阶段
第三节估计量和样本值
估计量性质
一致
估计量
样本量增大
真值
无偏
相等
样本均值
总体
均值
有效
方差越小
抽样误差的估计
无法避免
降低措施
增大
样本量
改进
估计量
选择
更有效的抽样方式
可计算
【知识点三】样本量的计算
计算
(1-样本量n/总体个数N)*样本方差/样本量n
影响因素
1、调查精度:
2、总体的离散程度:
离散程度
规模
4、无回答情况
5、经费的制约
第二十六章回归分析(2-3分)
第一节回归模型
回归分析与相关分析对比
相同点
研究对象
应用时互补
不同点
研究方法
目的
相关
相关
程度
方向
回归分析
变量间
具体形式
一元线性回归模型
Y=β0+β1x+E:
β0β1模型的参数
E:误差项,随机变量
X:因变量
第二节最小二乘法
定义
估计β0β1的模型数的方法
原理:因变量观测与估计离差平方和最小
第三节模型的检验和预测
回归模型的拟合效果分析
对模型检验
经济含义
是否合理
拟合效果
建设检验
对模型
决定系数R²
0≤R²≤1
R²=1
所有变化
解释
R²=0
无法解释
因变量变化
自变量
无关
模型预测
二元回归模型案例
第二十七章时间序列分析(3-5分)
第一节时间序列及其分类
含义
动态数列
统计指标
不同时间
先后顺序
构成要素
所属时间
指标值
时间单位
要求相等
分类
绝对数
时期
过程总量
示例
国内GDP
时点
示例
年底总人口数
序列
相对数
平均数
第二节水平分析
【知识点一】发展水平的有关概念
1.发展水平
2.最初水平、最末水平、中间水平
3.基期水平和报告期水平
【知识点二】平均发展水平
定义
序时/动态平均数
平均数
发展水平
概括
描述现象
一段时期
一般水平
时期序列
简单算数平均数
时点序列
连续
登记
逐日
计算
简单算数平均数
指标值变动
计算
加权算数平均
间断
间隔时间
相等
两次平均
简单算数平均
不相等
两次平均
第一次算数平均
第二次加权平均
【知识点三】逐期增长量与累计增长量
增长量=报告期水平-基期水平
逐期增长量
累积增长量
【知识点四】平均增长量
定义
序时平均数
逐期增长量
计算
逐期增长量的合计/逐期增长量的个数=累积增长量/时间序列个数-1
第三节速度分析
【知识点一】发展速度与增长速度
发展速度
定义
比值
发展水平
不同时期
定期:
报告期水平/基期水平
环比
报告期水平/前一期水平
两者间关系
定基
各个环比乘积
环比
相邻定基之比
相应时期
增长速度
定基
累积增长量/基期水平=报告期水平-基期水平/基期水平=定基发展速度-1
环比
环比发展速度-1
【知识点二】平均发展速度与平均增长速度
平均发展速度
定义
环比发展速度
平均数
环比发展速度连乘机开n次根号=定基发展速度开n根号
平均增长速度=平均发展速度-1
速度的分析与应用
第五节平滑预测法
移动平均法
计算方法:
前m个月的算数平均值
指数平滑法
系数*实际值+(1-系数)*预测值