导图社区 应用统计考研笔记
贾俊平应用统计考研思维导图,包含了导论,描述统计,概率与概率的分布,数理统计,推断统计,统计量及其抽样分布等内容。
编辑于2022-05-06 13:50:46统计学
第1章 导论
统计学
定义
收集、处理、分析、解释数据的科学
根据数据分析方法分类
描述性统计
数据的收集、处理、展示和分析
推断性统计
利用样本信息和概率论对总体信息推断
通过样本和总体数据探求总体的规律性
应用领域
数据类型分类
按计量尺度分类
定性数据/品质数据
分类数据
定类、分类尺度
顺序数据
定序/顺序尺度
定量数据/数量数据
数值型数据
定距/间隔尺度
定比/比率尺度
按测量尺度分类
定类、分类尺度
定序/顺序尺度
定距/间隔尺度
连续性
温度
百分制成绩
血压
离散型
人数
商品件数
0值存在
定比/比率尺度
体重
身高
0值不存在,只是被发明用来互相比较的
“0”表示“没有”或“无”
按收集方法分类
观测数据
实验数据
按收集状况分类
截面数据
时间序列数据
面板数据
结合了界面和时间序列
基本概念
总体与样本
总体
有限总体
无限总体
样本
样本量
个体
参数与统计量
参数
来自总体
统计量
来自样本
估计量
检验统计量
变量
基本分类
分类变量
顺序变量
数值型变量
根据取值不同
离散型变量
连续型变量
其他分类
随机变量
非随机变量
经验变量
理论变量
z、卡方、t、F
描述统计
第2章 数据的收集
数据的来源
间接来源
二手数据的特点
搜集容易,采集成本低
作用广泛
分析所要研究的问题
提供研究问题的背景
帮助研究者更好地定义问题
检验和回答某些疑问和假设
寻找研究问题的思路和途径
搜集二手资料在研究中应优先考虑
局限性
资料相关性不够
口径不一致
数据不准确
时效性不足
二手数据的评估
数据是谁搜集的?
可信度评估
为什么目的而搜集的?
数据是怎样搜集的?
什么时候搜集的?
直接来源(原始数据)
调查数据
通过调查方法获得的数据
通常是对社会现象而言
通常取自有限总体
实验数据
通过实验方法得到的数据
通常是对自然现象而言
也被广泛运用到社会科学中
如心理学、教育学、社会学、经济学、管理学等
调查数据
好样本
针对研究问题而言的
针对于调查费用与估计精度的关系而言的
符合最好的性能价格比
概率抽样/随机抽样
概念
概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
特点
抽样时是按一定的概率以随机原则抽取样本。所谓随机原则就是在抽取样本时排除主观上有意识的抽取调查单位,是每一个单位都有一定的机会被抽中。
每个单位被抽中的概率是已知的,或是可以计算出来
当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。这就是说估计量不仅与样本单位的观测值有关,也与其入样概率有关。
方式
等概率
简单随机抽样
定义
从包括总体N个单位的抽样框中随机地、一个一个的抽取n个单位作为样本,每个单位的入样概率上相等的。
特点
简单
直观
计量方便
局限性
要求将包含所有总体单位的名单作为抽样框,当N很大时,构造这样的抽样框并不容易。
抽出的单位很分散,给实施调查增加了困难
没有利用其它辅助信息以提高估计的效率
分类
重复抽样和不重复抽样
抽签
直接抽选法
随机数表法
分层/类型/分类/抽样
将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本
又称
优点
保证了样本中包含有各种特征的抽样单位,样本结构与总体结构比较相近,有效地提高估计的精度
在一定条件下为组织实施调查提供了方便
既可以对总体参数进行估计,也可以对各层的目标量进行估计
等概率
各群规模相等
整群抽样
定义
将总体中若干个单位合并为组,这样的组称为群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查
特点
抽样时只需要群的抽样框,而不必要求具有所有单位的抽样框,大大的简化了编制抽样框的工作量
调查地点相对集中,节省调查费用,方便调查实施
弱点
估计的精度较差,要得到与简单随机抽样相同的精度需要增加基本调查单位
各单位规模相等
系统/等距/机械/抽样
定义
将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位
优点
操作简单,若有辅助信息,对总体内的单位进行有组织的排列,可以有效地提高估计的精度
缺点
对估计量方差的估计比较困难
非等概率
各群规模相等
整群抽样
各单位规模不相等
系统抽样
等不等都行
多阶段抽样
定义
采用类似整群抽样的方法,首先抽取群,然后再进一步抽样,从选中的群币抽取若干个单位进行调查,即二阶段抽样,群是初级抽样单位,第二阶段抽取的是最终抽样单位。将这种方法推广,使抽样的段数增多。
优点
保证样本相对集中,节约调查费用
需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开
在大规模的抽样调查中,是经常被采用的方法
每阶段抽样方法可以不同
非概率抽样
概念
是相对于概率抽样而言的,指抽取样本时不是依据随机原则,二是根据研究目的对数据的要求,采用某种方式从总体中抽取部分单位对其实施调查
类型
1. 方便、随意、偶遇抽样
定义
是调查过程中由调查员依据方便原则,自行确定入抽样本的单位
特点
容易实施,调查成本低
弱点
样本单位的确定带有随意性
2. 判断抽样
了解
定义
是指研究人员换据经验、判断和对研究对象的了解,有目的地选择一些单位作为样本
方式
重点抽样
典型抽样
代表抽样
优点
成本较低,容易操作
弱点
主观性强,样本选择的好坏取决于调研者的判断、经验、专业程度和创造性,且调查结果不能用于对总体有关参数进行估计
3. 自愿抽样
4. 滚雪球抽样
优点
容易找到那些属于特定群体的被调查者,调查的成本也比较低
5. 配额/定额抽样
定义
类似于概率抽样中的分层抽样,首先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位
特点
操作简单,而且可以保证总体中不同类别的单位都能包括在所抽的样本之中;使得样本结构和总体结构类似
概率抽样与非概率抽样的比较
1. 对总体参数进行估计
概率抽样依据随机原则抽取样本,可以根据调查样本对总体参数进行估计,对估计的精度要求较高。
非概率抽样不依据随机原则抽取样本无法使用样本的结果对总体相应的参数进行推断
2. 概率抽样的技术含量较高,要求有较高的统计学专业知识。非概率抽样则不需要。
3. 抽样误差
概率抽样
可计算和控制误差
非概率抽样
不可
4. 用途
概率抽样用来进参数及区间估计
非概率抽样用于探索性研究,为更深入的数量分析提供准备
5. 概率抽样比非概率抽样的成本高
搜集数据
1. 基本方法
1. 自填式
优点
管理相对简单
成本低
可以进行大范围的调查
作答时间方便
同时可以避免被调查者回答敏感性问题的压力
缺点
问卷的回收率比较低
不适合结构复杂的问卷
调查周期比较长
数据搜集过程中出现的问题难于及时采取调改措施
2. 面访式
优点
缺点
3. 电话式
优点
缺点
4. 观察式
2. 搜集数据不同方法的特点
3. 选择方法时需考虑的问题
1. 抽样框中的有关信息
2. 目标总体的特征
3. 调查问题的内容
4. 有形辅助物的使用
5. 实施调查的资源
6. 管理与控制
7. 质量要求
实验数据
了解
实验组与对照组
实验数据
基本逻辑
实验组
对照组
不做处理
实验中的若干问题
未考过
实验中的统计
实验的误差
抽样误差
定义
是由抽样的随机性引起的样本与总体真值之间的误差。
抽样误差并不是针对某个具体样本的检测结果与总体真实结果的差异而言的,
抽样误差描述的是所有样本可能的结果与总体真值之间的平均性差异。
影响因素
样本量大小
总体变异性
如果所有的单位完全一样,调查一个就可以精确无误的推断总体,抽样误差就不存在。
抽样方法
不重复抽样的误差小于重复抽样的误差
抽样的组织方式
分层抽样误差最小,整群抽样误差最大
非抽样误差
抽样框误差
回答误差
理解误差
记忆误差
有意识误差
无回答误差
随机性
通过增大样本量的方式解决
系统性
预防
出现后,分析原因,采取补救措施
调查员误差
误差的控制
抽样误差是由抽样的随机性带来的,只要采用概率抽样,抽样误差就不可避免,但抽样误差是可以计算的。一旦误差确定下来,就可以采用相应的措施进行控制,进行控制的一个主要方法是改变样本量,要求的抽样误差越小,所需要的样本量就越大。
非抽样误差与抽取样本的随机性无关,因而在概率抽样与非概率抽样中都会存在。引起的原因也很多,控制起来比较困难,非抽样误差控制的重要方面是调差过程的质量控制。主要包括:调查员的挑选与培训;对调查结果进行检验、评估等
第3章 数据的图表展示
数据的预处理
不是考研的重点,但在实际应用中却是重点
数据的审核
目的
原始数据
完整性
准确性
二手数据
适用性
时效性
数据筛选
目的
数据排序
目的
发现特征或趋势
纠错
也可作为数据分析的内容
分类数据
字母型
升序
降序
汉字型
按拼音首字母
升序
降序
按比划多少
升序
降序
数值型数据
方式
递增
递减
顺序统计量
数据变换
标准化变换
数据标准化(指数化)
消除量纲
方法
标准分数Z
减均值除以标准差
只有原来正态,变换后是标准正态
极差标准化变换
最小-最大标准化
减均值除以极差
极差正规化变换
按小数定标 标准化
0-1变换
减极小值除以极差
优点
消除量纲,便于不同变量的比较
缺点
受极端值影响,可能导致数据过于集中,画图不好看
改进
引入排名
使数据梯度相同,应用于机器学习的预处理
应用
画雷达图
概要
转换前后变量的分布形状不变
只是尺度变了
不能将不同变量变成相同分布
分类
趋同化处理
解决数据不同性质的问题
使所有指标对测评方案的趋同力一致
再加总
无量纲化处理
解决可比性问题
BOX-COX变换
改善
正态性
对称性
方差齐性
自相关问题
参数估计有两种方法
最大似然估计
Bayes方法
估计参数值,确定哪种变换形式
幂变换
自相关问题
对数变换
正态性
异方差
对称性
正态性检验
1. 图示法
1. P-P图
P-P图和Q-Q图的用途完全相同
只是检验方法存在差异
2. Q-Q图
1、检验一组数据是否服从某一分布。
2、检验两个分布是否服从同一分布
如果两个分布相似,则该Q-Q图趋近于落在y=x线上
。如果两分布线性相关,则点在Q-Q图上趋近于落在一条直线上,但不一定在y=x线上。
3. 直方图
4. 茎叶图
5. 箱线图
6. 小提琴图
7. 核密度图
2. 偏度峰度检验
趋于0,则正态
3. 非参数检验
在总体分布假定比较弱的情况下,统计推断的方法
1. Lilliefor
2. K-S
柯尔莫戈洛夫-斯米诺夫检验(Kolmogorov-Smirnov test)
检验2个经验分布是否不同
或1个经验分布与另一个理想分布是否不同
3. S-W(W)
8=<n<=50
夏皮洛-威尔克检验(Shapiro—Wilk test
4. E-P
n>=8
Epps-Pulley 检验
4. 正态概率纸
不精确
数据的整理与展示
数据层次由低到高:分类数据、顺序数据、数值型数据。 适用于低层次的方法和图表适用高层次,但反之不行。 (因为品质数据可以通过分组变成数值型)
整理方法
分类整理
品质数据
分类数据
概念
频数
比例
同一类别占全部数据的比值,<=1
百分比
比例X100%
比率
样本或总体中不同类别数据之间的比值,可能大于1
顺序数据
概念
累计频数
向上累积
向下累积
累计频率
分组整理
数值型
分组数据
概念
上限
下限
组距
组中值
分组方法
单变量分组
组距分组
分类
等距分组
不等距分组
注意
将变量值的一个区间作为一组
适合于连续变量
适合于变量值较多的情况
需要遵循"不重不漏"的原则
可采用等距组,也可不等距分组
分组步骤
1. 确定组数
5<=k<=15
2. 确定各组间距
(最大值-最小值)/组数
3. 根据分组数据整理频数分布表
连续变量
上下限重叠
左开右闭
上限用小数表示
离散变量
组限间断
最值与其他值差距太大
使用开口组
图表展示
品质数据
分类型
条形图
简单条形图
高度/长度代表频数
复式条形图
帕累托图
帕累托法则(二八定律)
必须按频数降序排列
重要的放前面
并列条形图
堆叠条形图
脊形图
马赛克图
两个以上变量
面积表示频数
饼图
复式饼图
扇形图
环形图
多个总体
多维频数表
多维列联表
区别
复式饼图
单总体
变量属性值展开对比
环形图
多总体
变量属性值不展开对比
顺序型
(累计)频率(分布)图
(累计)频数(分布)图
数值型数据
原始数据
茎叶图
优点
能看出分布
保留原始信息(不同于直方图)
随时记录添加
缺点
适用数据少的情况
箱线图
特征值、指标
1. 最大值
2. 上四分位数
3. 中位数
4. 下四分位数
5. 最小值
用途
1. 反映原始数据分布特征
2. 进行多组数据分布特征的比较
优点、使用
1. 中位数看平均水平
2. 箱子长短(四分位差)看离散程度
3. 中位数在箱子的位置看分布
简答题说这一句话就行了,不要说后面引起争议的话
贾书说法
分布类型
对称
左偏
中位数右偏,左箱子更长
右偏
U型
实际
只能看出是否对称
无法精准确定左偏还是右偏
要算偏态
精准看分布类型方法
看上下相邻值到中位数的距离
完整版
可剔除异常值
小提琴图
核密度和箱线图的结合
分组数据
直方图
组成
宽度
组距
高/长度
频率
面积
频数
作为分布密度估计的不足
密度函数不光滑
密度函数受子区间宽度影响很大
不同宽度得到的直方图结果会不一样
数据维数增加,有局限性
直方图粗糙,核密度曲线更精准
核密度曲线
面积是1
折线图
时间序列数据
线图
相关图
多变量数据
两个变量
散点图
三个变量
气泡图
多个变量
雷达图
研究样本间的相似程度
拓展
轮廓图
展开的雷达图
闪电图
垂直的轮廓图
脸谱图
星相图
比雷达图可容纳更多变量
矩阵散点图
用excel作图、表
能看懂就行
合理使用图表
能够展示品质数据的图形一定能展示数值型数据
能展示数值型数据的图形不一定能展示品质数据
鉴别图表优劣准则
好图形特征
显示数据
让读者把注意力集中在图形的内容上,而不是制作图形的程序上
避免歪曲
强调数据之间的比较
服务于明确的目的
有对图形的统计描述和文字说明
准则
一张好图应当精心设计,有助于洞察问题的实质
一张好图应当使复杂的观点得到简明、确切、高效的阐述
一张好图应当能在最短的时间内以最少的笔墨给读者提供最大量的信息
一张好图应当是多维的
一张好图应当表述数据的真实情况
统计表的设计
组成
行标题
列标题
数据资料
附加
注意
表头
3W要求
when
where
what
第4章 数据的概括性度量
数据分布特征和测度
集中趋势
测度向中心集中靠拢的趋势。
位置
分类数据
众数
适用数据类型
主要适合分类数据
观察次数
顺序数据
观察次数
数值型数据
未分组
观察次数
分组
相邻两组频数
相等
组中值
不相等
近似权重公式
假定该组频数在组内均匀分布
概念
出现次数最多的值
M0
特点
不受极端值影响
个数
可能存在
1个
1个峰
多个
多个峰
不存在
没有峰
所有值的出现频率都一样
众数是比较出来的,一定要有多有少
数据分布的最高峰
顺序数据
中位数
适用数据类型
主要适用顺序数据
数值型数据
未分组
分组
概念
Me
特点
不受极端值影响
位置
(n+1)/2
求中位数
四分位数
适用数据类型
主要适用顺序数据
数值型数据
课本正文
以这个方法为准
课本备注
Qu
Qm
中位数
Ql
百分位数
数值型数据
平均数
适用数据类型
数值型数据
特点
容易受极端值影响
数学性质
各变量值与均值的离差和为0
各变量值与均值的离差和的平方最小
分类
算术平均数
简单平均数
加权平均数
几何平均数
用途
对比率数据的平均
计算平均增长率
调和平均数
针对为未分组
受极端值影响较小
比较
可能出简答题
实际M0可能=Me
对称分布
用中位数
偏态分布
用众数和平均数
离散程度
差异情况 不患寡而患不均,寡不寡是位置,均不均就是尺度
尺度
概念
反映各个变量值离中心距离的远近程度
用于衡量集中趋势测量度值的代表好坏
分类数据
异众比率
用于衡量众数对数据的代表程度
越大,代表性越差
越小,代表性越好
顺序数据
四分位差
别称
内距、四分间距
特点
不受极值的影响
作用
反映了中间50%的数据的离散程度
越小,中间的数据越集中
越大,中间的数据越分数
说明了中位数对一组数据的代表程度
数值型数据
方差
样本
n-1为自由度
总体
标准差
s
极差
全距
不能反映离散情况
平均差
可以反映离散情况
数学性质差,应用少
相对位置的度量
标准分数
作用
给出各个数值的相对位置
均值为0,标准差为1
对称分布
经验法则
68%
95%
99%
离群点
任何形状分布
切比雪夫不等式
相对离散程度
数据波动大小
离散(变异)系数
消除量纲
分布形状
偏态
偏态系数Sk
=0
对称分布
算术平均数=中位数
>1或<-1
高度偏态分布
0.5~1或-1~-0.5
中等偏态分布
>0
正偏/右偏
<0
负偏/左偏
峰态
峰态系数K
=0
正态分布
>0
尖峰分布
不一定高于正态,只是更尖
<0
平峰分布
和标准正态分布比较
JB检验
用偏度和峰度检验样本是否来自正态总体
5 概率与概率分布
见茆
数理统计
推断统计
Fisher命名 只研究简单随机抽样:1. 样本具有随机性,保证随机变量与总体同分布 2. 样本具有独立性
第6章 统计量及其抽样分布
统计量
定义
统计量中不依赖任何参数
习题
统计量中为什么不含任何参数
统计量是反映样本特点的数字特征,而参数时反应总体特点的数字特征。推断统计就是利用样本统计量来对总体参数进行估计或者假设检验。
是关于样本的函数
分类
常用统计量
样本均值
样本方差
样本变异系数
样本k阶矩
样本中心矩
样本偏度
样本峰度
茆书
次序统计量
充分统计量
抽样分布
是样本统计量的分布,不是样本观测值的
总体分布已知
三大抽样分布
卡方分布
特点
可加性需要满足相互独立的条件
t分布
又名student分布,由高塞特提出
补充
温良宽厚
肥尾
轻松排除异常值干扰,准确把握数据集中和离散趋势
用于小样本假设检验的原因
性质
F分布
相互独立
类似卡方
性质
方差基本不考
共性
连续型
由标准正态分布导出的重要分布
概率密度图都以上侧分位点(右尾)为准
口诀
正态方和卡方出,卡方相除变F
若想得到t分布,一正一卡再相除
渐近分布
随机模拟的渐近分布
模拟出来的是近似分布,不是精确的抽样分布
样本统计量的分布
Fisher引理
均值
样本均值
正态总体
要求总体正态分布 只是可以推出样本均值也是正态分布
若不是正态总体或大样本总体
只要样本点独立同分布
(无限总体或有限总体重复抽样) 认为每个样本是随机变量
均值和方差还是这个
但是不正态
有限总体的修(校)正系数
有限总体无放回(不重复)抽样
当n≤0.05N时,可以不用
两个样本均值之差
两样本均值
两个正态总体
两样本比例
两个二项总体
方差
正态总体
样本方差
正态总体
样本标准差和方差都正态分布
由卡方推
两样本方差比
比例
二项总体
中心极限定理
任意总体
n>=30,分布是近似,为非正态
补充
总体正态,小样本的样本均值也正态
第7 章 参数估计
对比表格见贾俊平书146、147
基本原理
基本概念
参数估计
估计量
用于推断参数的统计量
估计值
点估计
茆书
矩估计法
令总体的前k阶矩分别与样本的对应阶矩相等
最大似然估计
EM算法
任何分布的总体均值的点估计
样本均值
使得方差最小
样本中位数
使得平均差最小
中位数定义
总体方差点估计
正态分布
最大似然
s^2
无偏估计
矩估计
其他分布
不一定
区间估计
估计误差、边际误差
置信水平临界值 X 统计量的(抽样)标准(误)差
显著性水平、风险值
α
总体参数未在区间内的概率
置信水平、置信度、置信系数
含义
构造置信区间的步骤重复多次,包含总体参数的置信区间占全部置信区间的比例
补充
定义、方法角度
该比例一定等于置信水平
实际试验情况
该比例约等于置信水平
置信水平越大,Z(α/2)越大
表达了置信区间的可靠性
枢轴量法
置信区间
定义
=点估计量加减估计误差
注意
错误说法:总体参数以一定概率落在这一区间
是跟随样本变化的随机区间,不是固定的
构造某一特定区间后并无法确定其是否包含总体参数真值
特性
精确性
区间宽度越小,精确性越高,可靠性越低
可靠性
置信水平越大,可靠性越高
一般准则
保证置信水平的情况下,尽量提高精度(窄)
可信区间
贝叶斯估计
见茆书
把参数当作随机变量
评价估计量的标准
无偏性
即要求没有系统误差
无偏估计不唯一
例
有效性
比较出来的,不能说1个统计量具有 有效性
在无偏估计条件下,有更小的标准差、方差
一致性、相合性
基本要求
随样本量增大,越来越接近总体参数
与总体参数的离差小
判断相合性
建茆书
拓展
无偏
用方差判断有效性
有偏
用均方误差判断有效性
区间估计
一个总体
均值
大样本(无论总体是否正态)
只要是大样本,非正态总体也可近似正态
总体方差
已知
未知
小样本
对于小样本的非正态总体没有统计量可以估计,因为Z, t, 卡方,F都是由正态分布演变过来的
正态总体
总体方差
已知
未知
非正态总体
非参方法
比例
条件
大样本:np和n(1-p)>=5
(二项总体)
只要是大样本,非正态总体也可近似正态,所以无所谓是不是二项总体
方差
条件
正态总体
无论大样本 小样本
两个总体
均值之差
俩独立样本
大样本
估计量
置信区间
两个方差都已知
两个方差都未知
小样本 正态总体
方差未知
方差相等
估计量
置信区间
方差不相等
估计量
置信区间
匹配样本
和一个总体的均值参数估计一样
假定条件
两个总体各个观察值的配对差服从正态分布
估计量
置信区间
大样本
方差已知
方差未知
Sd
小样本 正态总体
比例之差
条件
大样本
(俩二项总体)
统计量
置信区间
方差之比
条件
俩正态总体
无论大样本 小样本
用两样本方差比来判断
置信区间
小结:统计量的选择
估计均值、均值之差
大样本
Z
小样本 正态
方差已知
Z
方差未知
t
估计比例、比例之差
Z
估计方差、方差之比
方差
卡方
方差之比
F
样本量的确定
估计总体均值时
估计误差
样本量
圆取整法则:向上取整
估计总体比例时
估计误差
样本量
圆取整法则:向上取整
拓展
非参数估计
总体分布未知
第8章 假设检验
基本问题
定义
先对总体参数提出一个假设
然后利用样本信息验证这个假设是否成立
假设检验的原理
逻辑上反证法
先假设发生
带有概率性质
统计上小概率原理
发生概率很小的随机事件在一次试验中几乎不可能发生
检验前人为指定
显著性水平:α
单侧、双侧检验
根据备择假设来定方向
这种也是单侧检验,左侧
单侧检验方向确定
小技巧,但计算简答不能这么答。 正的统计量和正的临界值比才有意义。
计算统计量
>0
右侧检验
<0
左侧检验
答题说法
根据以往经验,原来情况不好
所以原假设 <=
备择 >
右侧检验
两类错误
第一类错误
原假设为真时拒绝原假设
弃真错误、α错误
犯错最大概率
显著性水平:α
控制第一类错误原因
讨论方便
原假设更清晰
一错后果更严重
第二类错误
原假设为假时没拒绝原假设
取伪错误、β错误
犯错概率
β
1-β
反映假设判别能力
势
定义
不管哪个假设是否成立,参数真值的范围是全部参数空间
计算
落入拒绝域概率
统计量<临界值的概率
分类
当原假设成立时
g(θ)=α
当备择假设成立时
g(θ)=1-β
检验功效
对比
样本量一定
α β 此消彼长
检验差异越大
β越小
检验差异一定
增大样本量
2个都减小
样本量足够大
肯定能拒绝原假设
欲加之罪,何患无辞
α一定
样本量越大
β越小
计算
定义+标准化
14年11
α+β不一定=1
定义+定积分
假设检验的流程
1. 提出假设
表达式
原假设
符号
=
高达
是否
属实
达到要求
≥
至少
≤
零假设 H0
成立是不拒绝,不代表接受
没有拒绝原假设
不能表明备择一定错
原有的、传统的观点或结论
原假设都带等号
需要保护的
原假设具有优势
不能轻易拒绝的设置为原假设
研究者想要收集证据予以反对的假设
备择假设
符号
≠
>
高
超过
<
减少
研究假设 H1
研究者想要收集证据予以支持的假设
希望证明的命题
接受备择
原假设一定错
设置原则
所有结果都包含在2个假设里,且2个假设互斥
等号放在原假设
本着不轻易拒绝原假设的原则
2. 确定适当的检验统计量
3. 规定显著性水平、临界值、拒绝域
拒绝域
确定依据
原假设为真的条件下检验统计量的概率分布
4. 计算检验统计量的值
参数假设检验
一个总体参数的检验
检验统计量的确定
u(茆书写法)
Z
t
总体均值的检验
大样本(无论总体是否正态)
σ已知
μ0不是x-的真正均值
是假设中的值
故此统计量和标准化无关
实质是比较x-和原假设μ0
差异大到一定程度,拒绝原假设
参数估计的枢轴量里的μ是其真正均值
σ未知
小样本 正态总体
σ已知
σ未知
总体比例的检验
条件
大样本:np和n(1-p)>=5
(二项总体)
只要是大样本,非正态总体也可近似正态,所以无所谓是不是二项总体
总体方差的检验
条件
正态总体
无论大样本 小样本
两个总体参数的检验
均值之差
大样本
σ已知
σ未知
用s
小样本 正态总体
σ未知
σ已知
比例之差
总体比例相等
总体比例之差不相等
方差之比
条件
俩正态总体
无论大小
样本量足够大
无论正态
注意对于双侧检验
临界点位置
匹配样本
成对、非独立数据
一定要用成对数据的检验方法
可消除部分误差
对一个样本做2次实验
对2个一样的样本做1次实验
非参数假设检验
游程检验
检验随机性
游程
连续排列的个数
游程个数不多不少
代表有随机性
符号检验
检验总体p分位数xp
秩和检验
建立在秩及秩统计量基础上
例
检验总体中位数
使用情况
如果不满足参数假设检验的条件
5. 作出统计决策
方法
临界值法(传统拒绝域法)
比较统计量和临界值
分布表对应于
左尾概率1-α
Z
图中阴影部分的面积代表的是Z ≤ z的概率
右尾概率α
正常都应该是右尾概率
t
F
图像
Zα
临界值右侧曲线下的面积是α
同t、卡方、F
P
比较P值和α
P值
定义
当原假设为真时所得到的样本观察结果或更极端结果出现的概率
用于直接求P值
含义
观察到的(或实测)的显著性水平
表示H0能被拒绝的最小值
实际观测结果和原假设不一致的程度
P越小
不一致程度越大
检验越显著
=犯弃真错误的准确概率
未检验之前弃真错误概率是α,检验之后就是P
影响P值的因素
差异越大,n越大
P越小
拒绝原假设的理由越充分
拒绝原假设可能性越大
检验结果越显著
差异越显著
不能说有显著差异
计算
用定义
查表
判断方法
单侧
双侧
茆书公式
算完统计量直接查表得一半得概率
乘2得最终P
和α比
贾书有误
优点
更精细化地展示到底有多少差异
反映真实的显著性水平
给出拒绝H0的实际风险
无需查表
改变α,无需重新计算P
置信区间检验
不能说接受原假设
只是证明了构造的一个小概率事件没发生
其他有矛盾的小概率事件还可能发生
避免第二类错误发生
欲加之罪,何患无辞
检验差异一定、α一定的条件下,样本量足够大,肯定能拒绝原假设
统计显著
定义
当前显著性水平下拒绝原假设就是统计显著
举例
回归分析检验变量
统计显著和实际显著无关
6. 评估
不拒绝原假设
算β或功效(1-β)
拒绝原假设
计算效应量
展示差异大小怎样
R^2
科恩统计量
拓展
历史学派
频率学派
Fisher P值学派
原假设
小概率原理
反证法
P值
N-P学派
原假设和备择假设
两类错误
拒绝域
贝叶斯学派
在data为真情况下,model为真的概率
生活应用
找先验概率高的事件再做后续决策
P值的弃用
P值意义
反机率
在model为真情况下,data为真的概率
实际关心
在data为真情况下,model为真的概率
原则
1. p值可反映样本数据和实际情况的差异
2. p值不度量原假设为真的概率
3. 重要决策不能仅仅基于p值是否满足某一特定值
4. 正确决策要求完整实验数据
5. P值并不度量效应的大小
6. P值本身不能很好地度量假设
其他检验
平稳性检验
判断时间序列是否平稳
分类
描述统计
时序图
自相关图
数理统计
单位根检验
DF
ADF
PP
失拟性检验
判断回归方程是否可以接受
残差分析
对比模型带来的误差和随机误差
类比方差分析
总体分布检验
卡方检验
区别
参数估计
基于大概率
区间估计都是双侧
假设检验
基于小概率
单侧双侧都有
变量间关系
非因果关系
相关分析
相关分析
对两个变量相关关系的描述与度量
解决问题
判断变量之间是否存在关系
描述变量间的关系强度
相关系数
判断样本关系能否代替总体关系
显著性检验
和回归分析的区别
回归分析XY不平等
Y被X解释
回归分析X不是随机变量
回归分析不仅可以描述关系还可以预测和控制
变量间的关系
判断变量之间是否存在关系
确定关系
函数关系
非确定关系
相关关系
关系形态
线性相关
正相关
负相关
非线性相关
关系强度
完全相关
正相关
负相关
不相关
特点
一个变量的取值不能由另一个变量唯一确定
相关关系的描述与测度
只能说明线性关系强弱
假定
两个变量是线性关系
两个变量是随机变量
散点图
度量线性关系强度
相关系数
简单相关系数
总体相关系数
ρ
样本相关系数(相关系数r)
表达式见茆
背,可能考
类似协方差除以两个标准差
又称
Pearson相关系数
线性相关系数
相关系数
性质
取值范围
对称性
r数值大小与x和y原点及尺度无关
r仅仅是线性关系的度量,不能用于描述非线性关系
不能说明x,y有因果关系
X 经验解释
该解释必须建立在对相关系数的显著性检验的基础上
中度或高度相关才能建模
见14年4题
相关关系的显著性检验
说明总体是否存在线性关系
r的抽样分布
X r的显著性检验
既可用于小样本也可用于大样本
检验步骤
提出假设
建立检验统计量
进行决策
因果关系
 按数据计量尺度划分
第9章 分类数据分析
分类数据与卡方统计量
不同于之前的卡方
列联表
2个分类型变量
行边缘频数
最右1列
列边缘频数
最下1行
卡方统计量
计算步骤
虽然检验的是比例,但要用频数算
特征
要求
样本量大
只有2个单元
每个单元期望频数必须大于等于5
2个以上单元
20%的期望频数小于5
相关性检验
对一个分类变量的检验
拟合优度检验
df= (R-1)
期望频数
通过总体数量和相关比例算
对多个分类变量的分析
列联分析:独立性检验
df= (R-1)(C-1)
期望频数
原假设
各个比例相等
备择假设
各个比例不完全相等
列联表中的相关测量
φ相关系数
分母是乘法不是加法
φ=0
ad=bc
XY独立
|φ|=1
ad或bc=0
列联表某方向对角线全为0
XY完全相关
c/列联相关系数
特点
c<φ
V相关系数
列联分析中应注意的问题
了解
条件百分比表的方向
列联表中变量的安排
第10章 方差分析
变异数分析 Analysis of Variance,简称ANOVA 其实就是假设检验 不太可能考方差分析的完整过程,主要搞懂方差分析表
引论
概念
是实验设计的一种方法
因素、因子
水平、处理
总体
每个水平下样本对应的总体
有多个
观测值
数据误差
来源
组间误差SSA
随机误差
系统误差
组内误差SSE
随机误差
平方和
SST = SSE +SSA
SST: Sum of Squares for Total
SSE: Sum of Squares for Error
SSA: Sum of Squares among Groups
误差分析
均方、方差
基本假定
正态性
每个总体都应服从正态分布
对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本。
方差齐性
各个总体的方差必须相同
各组观察数据是从具有相同方差的总体中抽取的。
独立性
最重要,分析前就必须保证
不同水平间观察值是独立的
不同总体是独立的
比如,每个行业被投诉的次数与其他行业被投诉的次数独立
单因素方差分析
数据结构
步骤
1. 检验基本假定
正态性
详见数据预处理
方差齐性
图示法
箱线图
残差图
统计检验方法
总体正态
茆书内容
样本量相等的场合
哈特利(Hartly)检验、最大下检验
样本量相等或不相等都可
n>=5
巴特利特(Bartlett)检验
构造卡方
样本量较小或较大都可
修正的巴特利特检验
正态非正态都可
Levene检验
典型
转换数据
取各水平数据的平均差的绝对值
进行单因素方差分析
独立性
不满足的话对结果影响很大
搜集数据时就要控制
不用检验
检验结果不满足假定
数学变换
取对数
开方
box-cox
非参方法
1. 把数据转化为秩
秩是数据在所有数据中的大小排序
2. 构造H统计量
一种卡方
3. 假设检验
K-W
2. 检验步骤
1. 提出假设
其他方法
主效应、水平效应
利用方差分析数学模型
详见茆书
2. 构造检验统计量
1. 计算样本均值
2. 计算全部观测值总均值
3. 计算各个误差平方和
计算总平方和
计算组间平方和
注意要乘权重n
计算组内平方和
4. 计算统计量
1. 计算自由度
自由度定义
可自由取值、不受约束的变量个数
=总变量数-约束条件个数
一般一个约束条件会约束1个变量,让它变得不自由
2. 计算均方
SSA的均方MSA
SSE的均方MSE
3. 计算检验统计量F
为啥F是F分布
卡方之比
为啥是单侧检验
比值不可能小于1
3. 统计决策
方差分析表
会看
3. 拒绝原假设效应量
关系强度的测量
目的
看两个变量间关系是否显著
R^2=SSA/SST
多重比较
在拒绝方差分析的原假设后,在再用一个假设检验来检验某两个水平均值的差异
前提
拒绝原假设
目的
检验具体哪两个总体均值之间有差异
方法
LSD 最小显著差异方法
为啥是t检验
就是假设检验的t检验
步骤
其他方法
核心思想
构造新的统计量
特定统计量*样本平均数的标准误
检验统计量和构造的新统计量比较
重复数相等场合
T法
true
重复数不等场合
S法
HSD
SNK
Dunnet-t
双因素方差分析
概念
方差分析中涉及两个分类型自变量
类型
无交互作用/无重复双因素的
数据结构
分析步骤
1. 提出假设
2. 构造检验统计量
1. 计算各个误差平方和
总平方和
行因素误差平方和
注意要乘权重 每一行数据个数r
行因素误差平方和
随机误差项平方和
关系
SST=SSR+SSC+SSE
2. 计算统计量
1. 计算自由度
2. 计算均方
SSR的均方MSR
SSC的均方MSC
SSE的均方MSE
3. 计算检验统计量F
3. 统计决策
拒绝原假设效应量
关系强度的测量
偏效应量
有交互作用的/可重复双因素
数据结构
分析步骤
1. 提出假设
2. 构造检验统计量
1. 计算各个误差平方和
关系
SST=SSR+SSC+SSRC+SSE
2. 计算统计量
1. 计算自由度
2. 计算均方
3. 计算检验统计量F
3. 统计决策
拒绝原假设效应量
关系强度的测量
偏效应量
实验设计
析因设计
特点
2个及以上的
处理、因素
水平
重复、交互
无交互的双因素方差分析不算
观测值
数值型变量
正态、独立、同方差
缺点
因素增加时
计算复杂
给众多交互作用的解释带来困难
降维版 多因子方差分析
拉丁方三因素方差分析
均衡的不完全随机区组设计
正交设计资料的多因素方差分析
特殊处理的多因子方差分析
嵌套设计
效应因子随机
主因子变异大于嵌套因子变异
是隶属关系
嵌套因子可以取不同水平值或不同个数
不能分析因素间的交互作用
裂区设计
效应因子固定
区组配置随机
效应因子分先后顺序
副处理重复次数比主处理多
主要因子再副区
能分析因素间的交互作用
重复测量
回归分析
回归分析步骤
1. 数据清洗 标准化
注意消除量纲
2. 检验相关性
散点图
相关系数
中度或高度相关才能建模
见14年4题
3. 建模
模型
方程
参数估计
4. 检验模型
拟合优度
显著性检验
5. 检验假定
经典假定
变量假定
x是固定的\非随机的
无完全共线性
模型中两个或两个以上的自变量彼此相关时
y正态分布
对每一个给定的x
独立
不同分布
方差
一样
均值不一样
误差项假定
0均值
均值不=0,只是影响截距
同方差/方差齐性
正态性
独立同分布
一般大样本都满足
无自相关性
自相关性
主要见于时间序列
无内生性(外生性)
x和误差项无关
内生性
修正
异方差
1. 原因
1. 省略了某些解释变量
2. 模型设定误差
非线性设成了线性
3. 测量误差
4. 截面数据
主因
2. 修正
1. 找到被省略的变量加到模型中
2. 结合实际找到合适模型
3. 通过事先手段减少此类情况
解决
123原因
4. 加权最小二乘
小方差加大权,大方差加小权
5. 异方差稳健标准误法
6. 模型的对数变换
Box-Cox的一种
解决
4.截面数据
3. 后果
最小二乘
仍有无偏性
不具有效性
大样本
没有渐近有效性
t检验
失效
预测
失效
4. 检验
图示法
XY散点图
残差图
统计检验法
思想
检验残差是否随x变化而变化
Spearman Rank(斯皮尔曼等级)
Gleiser戈里瑟
Park帕克
G-Q / Goldfled-Quandt哥的菲尔德-匡特
Levene(莱文)检验
观察x与残差
是否存在
线性关系
BP(Breusch-Pagan)
存在线性关系
则方差不齐
非线性关系
White怀特 检验
自相关
1. 原因
1. 假自相关
遗漏解释变量
模型函数形式错误
2. 经济变量滞后
例如 经济危机滞后影响
3. 蛛网现象
4. 数据加工错误
消除季节因素不恰当差分引起
5. 误差项本身自相关
2. 修正
一阶差分法
基于广义差分的迭代法
HAC异方差自相关一致性方差法
Box-Cox转换
3. 后果
最小二乘估计的
低估真实方差
有偏
预测精度降低
4. 检验
图示法
XY散点图
线图
统计检验法
D-W
杜宾-瓦特森统计量(Durbin–Watson statistic)
Durbin h
自相关系数法
几乎不用
多重共线性
原因
变量选择
少了
造成异方差 自相关等问题
多了
造成共线性等问题
后果
使回归结果混乱
使参数估计值的
正负号产生影响
方差无限大
增减自变量
回归系数的估计量变化很大
显著性检验失去意义
某些回归系数的检验不显著
预测功能失效
最小二乘估计
仍然有效但不完美
检验
回归系数正负号与预期相反
检验是否存在
1. 自变量之间显著相关
2. 2个变量
散点图
相关系数
3. 多个变量
R^2大,F检验显著,t检验不显著
检验哪些变量间存在和程度
1. 算判定系数
1. 某自变量与其他自变量回归
1. 容忍度
<0.1
存在严重的多重共线性
2. 方差扩大因子
>10
存在严重的多重共线性
2. 剔除怀疑的自变量再回归
2. 特征值和条件指数
修正
贾书
删除相关的自变量
避免用t检验
既然处理不了问题,就处理发现问题的方法
对y值的推断限制在自变量样本值的范围内
变量选择
原则
引入统计量后进行F检验,看SSE是否减少
方法
向前选择
向后剔除
逐步回归
结合了向前选择和向后剔除
最优子集
采用有偏估计
岭回归
采用时间序列模型
异常值
回归分析领域的说法
原因
离群点
y/残差差异大
高杠杆点
x差异大
强影响点
子主题
XY共同影响
修正方法
删除残差
杠杆值
库克距离
检验
残差
标准化残差
学生化残差
内生性
修正
广义矩估计
工具变量
两阶段最小二乘
非正态性
后果
不影响最小二乘估计
影响F t检验
影响参数的区间估计
要用到t
修正方法
BOX-COX变换
bootstrap
一种抽样方法
从样本里再抽样
解决小样本问题
主要用于回归分析
检验
见数据的预处理和归纳
残差可以检验模型假定
正态性
独立性
方差齐性
线性假定
F里有残差
6. 效果评价
7. 预测
个别值
平均值
第11章 一元线性回归
均值线性回归
建模
一元线性回归模型
回归分析解决的问题
1. 从样本数据确定变量间的数学关系式
2. 对关系式的可信程度进行检验,找出哪些变量影响显著
3. 根据关系式预测某一变量取值,并给出预测可靠度
回归模型
参数
回归系数
特指1
回归方程
β1表示x每变动一个单位,y的平均变动值
平均
有量纲
估计的回归方程
拟合值
又称拟合
参数的估计
最小二乘法/最小平方法
见茆
优良性质
假定
误差项
独立
同分布
0均值
同方差
无自相关
最大似然估计
利用yi的分布为正态分布
性质
线性
无偏
有效
渐近无偏
渐近有效
相合性
模型检验
回归直线的拟合优度
变差
x的取值不同造成
除x外的因素
x对y的非线性影响
测量误差
平方和
正面度量
判定系数
表示y的变差中有R^2比例是由x引起的
绝对的拟合效果的度量
侧面度量
估计标准误差,回归抽样误差,标准差σ
表示用x来预测y的平均预测误差
算预测区间和置信区间会用到
茆书
不用推,记住
它是对误差项的标准差的估计,可以看作排除了自变量对因变量的线性影响之后,因变量随机波动大小的一个估计量,即用该回归方程对总成本进行预测时,平均误差是3.51个单位。
失拟性检验
来判断 回归模型 是否可以接受的检验
看模型带来的误差(失拟误差)大小
显著性检验
反应在方差分析表
检验回归系数
线性关系F检验
均方回归
均方残差
步骤
提出假设
计算检验统计量
做出决策
回归系数t检验
提出假设
计算检验统计量
做出决策
一元回归中等价
俩个检验本质一样
变量只有1个,t和F检验自由度一样,t再平方就是F
检验总体相关系数ρ
相关系数r检验
注意
一元回归中三个等价
多元回归只有F可用
残差分析
残差与残差图
分类
关于x
关于y^
用途
误差项ε
正态性
同方差
模型
线性假设
标准化残差
残差除以残差的标准差
标准化残差图
用途
判断误差项ε
正态性
依据
正常95%的点落在-2~2
2σ原则
结果评价
预测
点估计
平均值的估计
个别值的点估计
区间估计
预测区间:个别值
置信区间:平均值
对于同一个x0而言预测比置信区间要宽
第12章 多元线性回归
多元线性回归模型
回归模型
误差项基本假定
0均值
同方差
正态独立
回归方程
估计的多元回归方程
参数的最小二乘估计
太复杂用软件算
检验统计量选择
拟合优度检验
R^2
线性关系检验
F
变量参数检验
t
拟合优度
多重判定系数
多重相关系数/复相关系数
R
调整的多重判定系数
k是解释变个数,不包含常数项
估计标准误差
显著性检验
线性关系检验/总体的显著性检验
步骤
提出假设
计算检验统计量
注意自由度和方差分析不一样
做出决策
F>Fα
表明在多个自变量中至少有一个自变量与因变量之间的线性关系显著
回归系数检验与推断
检验每一个β
步骤
提出假设
计算检验统计量
记住各部分形式,一般会给出子部分的值,带值算就行
做出决策
置信区间的估计
缩小置信区间
增大样本容量
提高模型拟合优度
提高样本观测值的分散程度
预测
其他方法
第13章 时间序列分析和预测
特殊的回归分析
时间序列及其分解
概念
时间序列
同一现象在不同时间相继观察值排列而成的
成分
趋势T
线性
非线性
季节性 季节波动S
含有趋势
不含趋势
一年内重复出现的周期性变动
周期性 循环波动C
也称循环波动,通常由经济环境变化引起
随机性 不规则波动I
也称不规则波动,除去上三个以外的波动
时间序列分析
传统时间序列分析的一项主要内容就是把这些成分从时间序列中分离出来,并将它们之间的关系用一定的数学关系式予以表达,而后分别进行分析
按4种成分对时间序列的影响方式不同,时间序列可分解为多种模型,
模型
加法模型
乘法模型
分类
平稳序列
在某个固定水平上波动
非平稳序列
有趋势
有趋势和季节性
复合型
描述性分析
图形描述
增长率分析
按对比基期分类
环比增长率
定基增长率
按计算方法分
一般增长率
平均增长率
年度化增长率
注意问题
当观察值出现0或负数,不宜计算增长率
注意增长率与绝对水平的结合分析
增长1%的绝对值
预测的程序
1. 确定成分/类型
判断趋势成分是否存在
绘制时间序列线图
利用回归分析拟合趋势线,对回归系数进行显著性检验
确定季节成分
年度折叠时间序列图
2. 选择预测方法
是否存在季节性
否
是否存在趋势
否
平滑预测
简单平均法
移动平均法
简单移动平均法
加权移动平均法
指数平滑
思想
近期加大权,远期加小权
一次指数平滑
预测误差
如何选择α
二次指数平滑
三次指数平滑
是
趋势预测方法
线性趋势推测
非线性趋势推测
自回归预测模型
是
季节性预测法
季节多元回归模型
季节自回归模型
时间序列分解
3. 评估预测方法
原则
误差最小
平均误差
平均绝对误差
均方误差
平均百分比误差
平均绝对百分比误差
4. 预测
平稳序列
简单平均法
移动平均法
指数平滑
单位根检验
检验是否是平稳
存在单位根过程就不平稳
趋势型序列
线性趋势
假定
和回归分析一样
非线性趋势
指数曲线
多阶曲线
复合型序列的分解预测
步骤
计算季节指数
平均趋势剔除法
计算移动平均值
计算移动平均的比值
季节指数调整
分离季节成分
第14章 指数
华师考过一次选择
基本问题
概念
测定多项内容综合变动的相对数
实质是测定多项内容
表现形式是动态相对数
分类
按照考察对象的范围不同
个体指数
总指数
按照所反映的指标性质不同
数量指标指数
Iq (quantity index)
质量指标指数
Ip (performance/price index)
按照计算形式不同
简单指数
加权指数
按照计算过程不同
综合指数
平均指数
可以各种交叉复合分类
指数编制中的问题
选择项目
计算权数
计算方法
总指数编制方法
简单指数
计算方法
简单综合指数
先综合,在对比
优点
操作简单,对数据要求少
缺点
简单平均指数
先对比,再综合
优点
操作简单,对数据要求少适用于指标值相差较大的商品
缺点
没有考虑权重的影响
加权指数
加权综合指数
拉0帕1
拉氏指数
作为权重的度量因素固定在基期
缺点
帕氏指数
作为权重的度量因素固定在报告期
特点
加权平均指数
区别
出发点
先综合再平均
先平均再综合
权不同
不同时期的数量或价格
不同时期的价值
依据资料不同
全面资料
样本非全面资料
指数体系
加权综合指数体系
平均数变动因素分解
几种典型的指数
居民消费价格指数 CPI
作用
反映通货膨胀状况
反映居民购买力水平
测定职工实际工资水平
包含262个商品与服务的价格
股票价格指数
综合评价指数
构建综合评价指数的步骤
1. 建立综合评价指标体系
2. 评价指标的无量纲化处理
3. 确定各项评价指标的权重
4. 计算综合评价指数
综合评价指数的构建方法
无量纲化处理
统计标准化
相对标准化
功效系数法
加权