导图社区 计量方法部分思维导图
这是一篇关于计量方法部分思维导图,包含估计面板数据模型参数、随机变量间存在多重共线性、异方差等。
编辑于2023-11-07 14:47:27从最小二乘法出发
最小二乘法OLS
普通OLS
估计方法
BLUE最优线性无偏估计
经典线性回归模型
模型形式
满足假设
线性
非线性或者变化的参数
Var(X)不为0,X是有变化的样本
导致变量的误差
Xt是非随机的,即
自回归
E(ut)=0,误差项是一个真正的扰动
违背会导致有偏的截距项
同方差,对于所有的t,
异方差
序列独立,对于所有的
序列相关
残差独立及同一正态分布,均值为0
极端值
观察值至少大于2,观察值大于解释变量个数,保证变量之间没有严格的线性关系
多重共线性
结果的多种表示:《应用计量经济学》
间接最小二乘法ILS
恰好识别方程
过程
找到简约方程
用OLS方法估计
得到唯一的结构系数估计
效果
一致,渐进有效和渐进正态的
但是大多数都是过度识别的,且要先找简约型方程比较繁琐
克服存在内生性问题
两阶段最小二乘法
过度识别方程
过程
把每个作为回归元的内生变量对系统中所有内生变量和滞后内生变量进行OLS回归
用步骤1得到的Y拟合值作为原始回归方程内生回归元的代替或是工具
工具变量要具有相关性及外生性原则
存在双向因果关系
遗漏变量
(58)
面板广义矩估计( GMM)
作用
为了缓解内生性问题对估计结果的影响
估计面板数据模型参数
广义两阶段最小二乘法
使用对象
(34)
异方差
广义最小二乘法GLS
原理:对修正的模型使用OLS进行估计
全面可行广义最小二乘估计法(全面FGLS)
GLS
处理异方差
对σi^2的结构进行假设,如假设
修正模型:
使用对象
估计面板数据模型参数
(34)
加权最小二乘法WLS
原理:通过权数ωi调整变量
修正模型:
处理异方差
对σi^2的结构进行假设,如假设
通过变换模型,使之成为不再具有异方差或序列相关性的模型
White修正
Newey-West修正方法
修正OLS估计量的标准差,纠正模型具有异方差性或者序列相关性时OLS估计量的非有效性,使得继而进行的统计推断仍然有效
非线性最大似然估计
将模型看成一类非线性模型,用最大似然方法同时估计模型的结构参数和描述异方差性或者序列相关性的参数
随机变量间存在多重共线性,
岭回归估计
机器学习算法原理与编程实现
需要先对数据集进行标准化处理
是回归参数的一个有偏估计,但是存在多重共线性时比最小二乘法结果优。
可以用岭迹图分析判断最小二乘法估计结果是否合理
存在自相关
极大似然估计
迭代估计
ARCH模型
模型
保证生成序列Yt平稳的约束条件
ARCH(q)难以保证
GARCH(1,1)是无限ARCH过程
GARCH(1,1)
模型
保证生成序列Yt平稳的约束条件
广义差分法
存在自相关
已知自相关系数ρ
t和t-1期模型做差分
未知ρ
Cochrane-Orcutt迭代法(处理自相关)
先用OLS估计模型
估计差分模型
重新估计残差模型
停止法则:连续两次ρ估计值都不大于预先选定的值
Hildreth-Lu搜寻程序(处理自相关)
重复选择-1-1之间的ρ带入做差分,选择RSS最小的值
被解释变量是受限被解释变量
断尾回归方法
样本关系存在非线性性
径向基网络
极大对数似然估计
等价于加权非线性最小二乘估计
非线性最小二乘估计
极大似然估计中J1=..Jn=1时,最大对数似然估计才等价于非线性最小二乘估计
加权非线性最小二乘估计
中心主题
比较两估计结果优劣的方法
用误差平方和 ( SSE) 、平均绝对误差 ( MAE) 、平均相对误差 ( MAPE) 、均方根误差 ( MSE) 、均方根 ( RMSE)
(33)
模型转换
分布滞后模型
滞后项过多损失自由度,可能发生多重共线性
Koyck转换
系数beta以几何形式递减
Almon转换
系统beta与关于i的多项式近似
自回归模型
协整关系检验
单协整
Engle和Granger协整检验
步骤
检验变量单整阶数
OLS估计
检验残差的单整阶数
ADF检验
临界值与平稳性检验的不一样
估计误差修正模型
缺陷
两个以上变量无法检验
依赖于第二步的估计结果
多协整
Johansen协整检验
VAR因果检验
原因
VAR模型没有理论基础,难以解释
Granger因果检验
原理
使用yt过去值作为解释变量能更好的预测xt,则称yt是xt的Granger原因
步骤
确定最大滞后项数
使用 LR、 FPE 和 AIC 标准,确定最优滞后项
估计存在x,y滞后性的VAR方程,检验系数的显著性
进行变量剔除检验确定因果关系
F统计量
Sims因果检验
原理
任何的因果关系下未来都不可能影响现在
步骤
加入x,y滞后性外,在y方程中加入x的超前值,x方程中加入y的超前值
如果y导致x,那么y与x的超前值之间一定存在某些关系
进行约束和无约束方程估计检验
F统计量
模型检验
模型选择的一般准则(模型拟合优劣)
展示回归方程与数据的拟合优度
可能存在的一些问题
虚假回归,不相关的变量显示很高的趋势
可能存在Z却被忽视了
显示了相关性,但是不一定有因果关系
时间序列方程比截面方程R更高
较小的R可能是选错了X,也可能是模型形式错误
不同形式Y得到的R 是不可比的
调整
随着解释变量的增加,会降低RSS,因此进行调整
AIC(最常用的)
FPE
SBC
相比其他标准对更复杂的模型有更严厉的惩罚程度
ARMA模型适用
HQC
GGV
评估logit模型
count
正确预测的次数/观察量
Kennedy
分D=1,D=0两部分
McFaddenpesudo-
LR统计量的比
模型形式是否合理
单个系数是否显著
t统计量检验
|t-stat|>|t-crit|则系数显著
样本量大时可运用简单判断法则|t-stat|>2
检验线性约束
可用约束条件
整体均为0(检验整体模型合理性)
某个解释变量是否可以增加或删除
解释变量间是否存在特定关系
检验方法
似然比检验
F形式的似然比检验(F统计师,RSS)
LR
Wald检验
拉格朗日乘子(LM)检验
仅估计约束模型,然后运用公式检验放松约束的情况
比较两个模型那个更优
Box-Cox转换
构建合适的Y,同时用两个模型进行估计,可以直接比较两个方程的RSS
错误设定
Ramsey RESET检验(最常用)
结构稳定性
Chow检验
分割样本,用SSR做F统计量
多重共线性
后果
参数估计值不准确
应该显著的参数但是t值减小
估计值不稳定,系数符号错误
检验方法
两两相关性
检查相关系数,不超过0.9
多个解释变量
很小的方差标准误、很大的R方,所有回归系数均显著的t值
被估计参数t值的标准误在进行不同估计时不同
估计参数的稳定性很差
异方差
后果
OLS估计值仍然无偏和一致,但不是有效的
影响估计量的方差,进而影响标准误,进而t统计量和F统计量的期望值变大,不再可靠
检验方法(最优的是White检验)
观察散点图,Y或X是否和残差有清晰的线性关系
LM检验
步骤
做一个残差与决定误差项方差的变量(一般是解释变量)的辅助回归
构造原假设:辅助方程系数均为0
计算统计量
Breusch-Pagan类检验
检验模型
Breusch-Pagan LM检验
辅助回归
Glesjer LM检验
辅助回归
Harvey-Godfrey LM检验
辅助回归
Park LM检验
辅助回归
缺点(前四个):需要先验知道什么导致了异方差
White检验(所有方法包括Goldfeld检验方法中最优的)
辅助回归
Goldfeld-Quandt检验
理论:样本一部分的方差应该和样本另一部分方差相同
步骤
将与干扰项方差密切相关的变量观察值按降序排列
略去中间c个值,组成两个子样本
对子样本进行回归,建立F统计量
缺点:没有考虑多个变量引起异方差的情况,不适用于时间序列数据
条件异方差
ARCH-LM检验
先用OLS方法估计
检验模型:
统计量:LM=(n-p)R^2。满足自由度为p的χ2分布
估计方法
迭代法(极大似然法的特例)
处理方法
处理方法:使用新的估计方法或修正协方差和t统计量并承认估计量不再完全有效
稳健标准误
(63)
自相关
可能出现的原因
模型中遗漏的变量具有自相关性
模型设定错误
度量存在系统性错误
后果
估计量无偏一致,但是无效的
回归系数方差的估计量有偏且不一致,R方被高估,t统计量变高
检验方法
作图法
Durbin-Watson检验
有效条件
回归模型包含常数项
只存在一阶序列相关
方程不存在滞后的因变量作为解释变量
检验方法
估计残差
计算DW统计量
经验:d接近于2,则很可能不存在序列相关
Durbin h检验
允许包含滞后因变量
统计量为
Breusch-Godfrey LM检验
估计得到ut
估计模型
计算LM=(n-p)R^2
残差的正态性
Jarque-Berra(JB)统计量
计算残差的二阶、三阶、四阶矩
计算JB统计量
ARIMA模型选择
Box-Jenkins模型选择
识别(观察Y的自相关函数和偏相关函数)
首先观察ACF是否衰减,得到平稳数据
MA(q)
ACF在q阶之前显著异于0,q阶之后立即衰减
PACF以指数形式迅速衰减或以正弦波形式震荡衰减
AR(p)
ACF以指数形式迅速衰减或以正弦波形式震荡衰减
PACF在p阶之前显著异于0,q阶之后立即衰减
ARMA(p,q)
ACF/PACF都缓慢衰减(ARMA(1,1))
ACF/PACF滞后q期开始衰减(ARMA(p,q))
估计
用AIC和SBC最小的模型,满足简约型
诊断
最滞后的系数是否显著
误差项的ACF和PACF是否均不显著
估计性质(BLUE)
线性
估计量是Y的线性函数
无偏性
有效性
所有无偏线性估计量中最有优的
一致性
当样本容量趋于无穷大时,估计的参数值趋近于总体真实参数值
中心主题
两序列之间是否有显著差异
D-M 检验
(31)
单位根检验
伪回归
非平稳或存在趋势的数据在OLS回归中会得到一个>0.95的R^2和一个>4的t值
DF检验
构建方程
检验原假设
对γ进行显著性t检验,但有特殊的临界值
小于临界值,拒绝H0,yt平稳
缺陷
要以误差项独立分布且方差项为常数为假设
ADF检验
消除误差项的自相关
构建方程
Phillips-Perron(PP)检验
原理:提出广义的ADF检验,放松对误差项分布的要求
方程依然是
调整t统计量的临界值,临界值的渐进分布与ADFt统计量相同
异方差
后果
OLS估计值仍然无偏和一致,但不是有效的
影响估计量的方差,进而影响标准误,进而t统计量和F统计量的期望值变大,不再可靠
检验方法(最优的是White检验)
观察散点图,Y或X是否和残差有清晰的线性关系
LM检验
步骤
做一个残差与决定误差项方差的变量(一般是解释变量)的辅助回归
构造原假设:辅助方程系数均为0
计算统计量
Breusch-Pagan类检验
检验模型
Breusch-Pagan LM检验
辅助回归
Glesjer LM检验
辅助回归
Harvey-Godfrey LM检验
辅助回归
Park LM检验
辅助回归
缺点(前四个):需要先验知道什么导致了异方差
White检验(所有方法包括Goldfeld检验方法中最优的)
辅助回归
Goldfeld-Quandt检验
理论:样本一部分的方差应该和样本另一部分方差相同
步骤
将与干扰项方差密切相关的变量观察值按降序排列
略去中间c个值,组成两个子样本
对子样本进行回归,建立F统计量
缺点:没有考虑多个变量引起异方差的情况,不适用于时间序列数据
处理方法:使用新的估计方法或修正协方差和t统计量并承认估计量不再完全有效
条件异方差
ARCH-LM检验
先用OLS方法估计
检验模型:
统计量:LM=(n-p)R^2。满足自由度为p的χ2分布
估计方法
迭代法(极大似然法的特例)
自相关
可能出现的原因
模型中遗漏的变量具有自相关性
模型设定错误
度量存在系统性错误
后果
估计量无偏一致,但是无效的
回归系数方差的估计量有偏且不一致,R方被高估,t统计量变高
检验方法
作图法
Durbin-Watson检验
有效条件
回归模型包含常数项
只存在一阶序列相关
方程不存在滞后的因变量作为解释变量
检验方法
估计残差
计算DW统计量
经验:d接近于2,则很可能不存在序列相关
Durbin h检验
允许包含滞后因变量
统计量为
Breusch-Godfrey LM检验
估计得到ut
估计模型
计算LM=(n-p)R^2
正态性检验
Jarque-Berra(JB)统计量
计算残差的二阶、三阶、四阶矩
计算JB统计量