导图社区 计量经济学 第六章 多重共线性
计量经济学 第六章 多重共线性
跨国公司内部贸易,跨国公司的转移定价策略:转移定价通常做法:调整子公司半成品或零部件的进出口价格、调整向子公司出售机器设备的价格和折旧期限。
计量经济学 第5章自相关性知识总结,包括自相关性定义产生的原因、自相关性的后果、自相关性的检验、自相关性的解决方法等。
计量经济学 第6章 多重共线性知识总结,包括多重共线性及其产生原因、多重共线性造成的影响、多重共线性的检验、多重共线性的解决方法等。
社区模板帮助中心,点此进入>>
英语词性
费用结算流程
租赁费仓储费结算
E其它费用
F1开票注意事项
F2结算费用特别注意事项
洛嘉基地文件存档管理类目
法理
刑法总则
【华政插班生】文学常识-先秦
多重共线性
多重共线性及其产生原因
定义
数学意义
对于变量x1,x2,x3...xk,如果存在不全为0的常数a1,a2,...ak,使得a1x1+a2x2+...+akxk=0,则称变量x1,x2...xk之间存在完全共线性
计量意义
一个具有两个以上解释变量的线性回归模型中,如果解释变量之间存在上式那样的关系,则称这些解释变量之间存在完全的多重共线性
产生原因
1、经济变量之间往往存在同方向的变化趋势
2、经济变量之间往往存在着密切的关联度
3、在模型中引入滞后变量也容易产生多重共线性
4、在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性
多重共线性造成的影响
完全共线性下参数估计量不存在
近似共线性造成的影响
1、增大最小二乘估计量的方差(但仍是所有方差中最小的)
2、参数估计量经济含义不合理
3、变量的显著性检验和模型的预测功能失去意义
bi^的方差很大,其标准差亦随之增大,t统计量偏小,容易淘汰一些不应淘汰的解释变量,使统计检验结果失去可靠性
b^的置信区间很大,使区间估计用于判断参数估计值的可靠性失去意义,变大的方差容易使预测的“区间”变大,从而降低预测精度,使预测失去意义
4、回归模型缺乏稳定性
多重共线性的检验
1.相关系数检验法
2.法勒-格劳伯检验
卡方检验
检验多元回归模型中所有解释变量之间存在共线性及共线性的程度
若解释变量之间的样本相关系数rij=0,i≠j,则说明这k个变量x1,x2,..xk是正交的。 计算解释变量之间的样本相关系数,构成相关系数矩阵A,当解释变量存在完全共线性时|A|=0;当解释变量相互正交时,|A|=1;解释变量存在多重共线性时,0<|A|<1。多重共线性程度越高,|A|越偏离1而接近于0,也就是说解释变量就越偏离正交而接近完全共线性。 卡方检验的假设 原假设:H0:xi之间是正交的;备择假设H1:xi之间不是正交的。 统计量与其临界值相比较,若>则拒绝原假设,接受多重共线性假设;若<则不拒绝原假设,不存在多重共线性。
F检验(辅助回归模型检验)
确定哪些解释变量是多重共线的。
解释变量之间存在多重共线性可以看做是一个解释变量对其余解释变量的近似组合。 分别建立每一个解释变量与其他解释变量的线性回归方程,检验xi与其他(k-1)个解释变量之间的线性关系是否显著,即xi与其他(k-1)个解释变量是否存在显著多重共线。
将每个解释变量xi月其余解释变量xj进行回归,得到k个回归方程
分别求出其拟合优度及统计量F1,F2...Fk,若其中一个最大的R^2接近1,Fi显著地大于临界值,则xi与其余xj存在多重共线性。
t检验
找出造成解释变量多重共线性原因的是哪些变量
3.VIF检验
方差膨胀因子VIF,用来测定一个解释变量被其他解释变量所解释的程度,每一个解释变量都有相应的VIF值
VIF=1/(1-R^2)
当xi与模型中其他解释变量存在严重的多重共线性时,Ri^2→1,VIF→∞,共线性程度越强;若Ri^2=0,则VIF=1,此时不存在多重共线性
认为VIF>10或>5时,模型存在严重的多重共线性
4.特征值(条件数)检验
模型存在完全共线性时,rank(X)<k+1,|X'X|=0
模型存在严重多重共线性时,|X'X|≈0
利用特征值构造用于检验多重共线性的指标
条件数(病态数)CN=最大特征值/最小特征值
条件指数(病态指数)CL=CN^(1/2)
都反映了特征值得离散程度,数值越大,表明多重共线性越严重。
5.根据回归结果判断
若R^2很大且F值显著地大于给定显著性水平下的临界值
(1)系数估计值的符号与理论分析结果相违背;
(2)某些变量对应的回归系数t值偏低或不显著
(3)当一个不太重要的解释变量被删除后,或改变一个观测值时,回归结果显著变化
则该模型可能存在多重共线性
多重共线性的解决方法
1、保留重要的解释变量,去掉次要的或可替代的解释变量
2、利用先验信息改变参数的约束形式
3、变换模型的形式
1.变换模型的函数形式
2.变换模型的变量形式
3.改变变量的统计指标
4、综合使用时序数据与截面数据
5、逐步回归法
1.利用相关系数从所有解释变量中选取相关性最强的变量建立一元回归模型
2.在一元回归模型中分别引入第二个变量,共建立k-1个二元回归模型(设共有k个解释变量),从这些模型中再选取一个较优的模型。选择时要求模型中每个解释变量影响显著,参数符号正确,调整的R^2值有所提高。
3.在选取的二元回归模型中以同样方式引入第三个变量;如此下去,直至无法引入新的变量位置。
6、增加样本容量
7、主成分回归
CL>10即认为存在多重共线性,>30认为存在严重的多重共线性