导图社区 计量经济学导论(伍德里奇)汇总第三篇:高级专题
这是一篇关于汇总第三篇:高级专题的思维导图,主要内容包括:第十六章:联立方程模型SEM,第十五章 工具变量估计与两阶段最小二乘法,第十四章:高级面板数据方法,第十三章:跨时横截面的混合:简单面板数据方法。
编辑于2024-09-27 16:12:37这是一篇关于第五章:多元回归分析:OLS的渐进性(大样本)的思维导图,主要内容包括:拉格朗日乘数统计量(Lagrange Multiplier, LM),渐近有效性,渐进正态和大样本推断,一致性(consistency)。
这是一篇关于第四章:多元回归分析:推断的思维导图,主要内容包括:检验对多个总体参数的假设:F检验,检验对单个总体参数的假设:t检验,OLS估计量的抽样分布。
这是一篇关于第七章:含有定性信息的多元回归分析:虚拟变量的思维导图,主要内容包括:政策分析和项目评价(自选择问题),二值因变量:线性概率模型LPM,虚拟变量的交互作用,使用多类别虚拟变量,只有一个虚拟变量的情况,对定性信息的描述。
社区模板帮助中心,点此进入>>
这是一篇关于第五章:多元回归分析:OLS的渐进性(大样本)的思维导图,主要内容包括:拉格朗日乘数统计量(Lagrange Multiplier, LM),渐近有效性,渐进正态和大样本推断,一致性(consistency)。
这是一篇关于第四章:多元回归分析:推断的思维导图,主要内容包括:检验对多个总体参数的假设:F检验,检验对单个总体参数的假设:t检验,OLS估计量的抽样分布。
这是一篇关于第七章:含有定性信息的多元回归分析:虚拟变量的思维导图,主要内容包括:政策分析和项目评价(自选择问题),二值因变量:线性概率模型LPM,虚拟变量的交互作用,使用多类别虚拟变量,只有一个虚拟变量的情况,对定性信息的描述。
汇总第三篇:高级专题
第十五章 工具变量估计与两阶段最小二乘法
动机:简单回归模型中的遗漏变量
面对遗漏变量
忽略,得到有偏且不一致估计量
寻找合适的代理变量
假定遗漏变量不随时间变化,用固定效应模型
工具变量法,承认存在遗漏变量
工具变量的必备特征
工具外生性
工具变量z与误差μ不想管
工具相关性
工具变量z与对应解释变量相关
对于工具变量的检验
对于工具外生性
我们无法直接检验z是否外生,一般需要借助于经济行为和反思来解释
对于工具相关性
我们可以直接检验
H0: Π1=0
进行T检验即可
IV估计量
用IV估计法做统计推断
低劣工具变量条件下IV的性质
低劣工具变量或者弱工具变量
z与x的相关性很弱
多元回归模型的IV估计
考虑两个解释变量的标准线性模型(结构方程,不一定是因果关系)
给y2找工具变量
因为z1已经出现在方程中,所以不能作为y2的工具变量,我们设z2为一个工具变量
工具外生性
不好检验,需要经济逻辑和反思
工具相关性
两阶段最小二乘
单个内生解释变量
结构方程:
考虑z1, z2和z3的线性组合作为工具变量
约简型方程:
因为这三个解释变量都外生,所以整个线性组合也外生,可以作为y2的工具变量
两阶段最小二乘(2SLS)步骤
多重共线性与2SLS
2SLS的渐近方差
显然,2SLS估计量的方差大于OLS估计量方差,如果存在多重共线性,2SLS的方差会更加严重,当然,大样本有利于解决这个问题
检测弱工具变量
Stock和Yogo提出了检测弱工具变量导致实质偏差情形的方法
经验规则
如果一阶段t值的绝对值大于根号10(3.2),就可以继续使用
对于多个工具变量的F值,F应该>10
多个内生解释变量
方程识别
阶条件 (Order Condition)
识别的必要条件
我们需要被排斥的外生变量至少与结构方程中包括的内生解释变量一样多
秩条件 (Rank Condition)
识别的充分条件
联立方程模型一章会提及
2SLS估计后对多个假设的检验
由于R方可能为负,通常的F不能使用,一般将第二阶段回归得到的残差平方和与SSRur结合起来,以获得一个在大样本下近似服从F分布的统计量
变量误差问题的IV解决方法
我们知道,一旦模型存在测量误差,那么就会存在内生性问题,我们可以考虑采用工具变量法
我们可以找到需要变量的第二个度量,作为第一个度量的工具变量,然后再使用IV估计法即可
内生性检验与过度识别约束检验
豪斯曼(Hausman)内生性检验
可以直接比较OLS和2SLS估计值,判断其差异是否统计显著,如果所有变量都外生,那么OLS和2SLS一致;否则就会存在差异,断定存在内生性
步骤
通过将y2对所有外生变量回归而估计y2的约简型方程并得到残差v2
在结构方程中添加v2,并用一个OLS回归检验v2系数的显著性,若拒绝原假设则为内生
过度识别检验
识别问题
过度识别
工具变量个数>内生解释变量个数
恰好识别
工具变量个数=内生解释变量个数
不可识别
工具变量个数<内生解释变量个数
Hausman提出
可以通过多个工具变量得到不同的估计量,再利用估计量之差来检验工具变量是否都是外生
步骤
1. 用2SLS法估计结构方程,并获得2SLS残差u1
2. 将u1对所有外生解释变量回归,得到拟合优度R方
3. 在所有IV都与u1不相关的原假设下,n*R方服从于自由度为q的卡方分布,q是模型之外的工具变量数
异方差条件下的2SLS
加权2SLS
2SLS应用于时间序列方程
运行机制完全相同
但对于强持续性(单位根)序列需要谨慎处理,往往会先进行差分
在2SLS后检验AR(1)序列相关
①用2SLS估计原方程并获得残差
②在原方程中加入残差的滞后项,再用2SLS估计,判断残差滞后项的系数是否为0,拒绝为0的原假设则意味着存在序列相关性
如果是含AR(1)误差的2SLS,可以在前两步的基础上,进行准差分操作,即y减去y上一期值*ρ,解释变量和工具变量同理操作
2SLS应用于混合横截面和面板数据
与前述一致
第十六章:联立方程模型SEM
联立方程模型的性质
在联立方程模型的方程组中,每个方程都要有其他条件不变的因果性解释
每个方程都要有其他条件不变的解释并且是独立的
但是每个方程在经济分析中又有联系,比如供给和需求曲线,在实际观测中我们只能看到联立方程模型均衡状态下的结果。
变量
外生变量
内生变量
OLS中的联立性偏误
当一个解释变量与因变量被联立决定时,它通常与误差项相关,因而会出现内生性问题
约简型方程 (Reduced form)
将y1代入y2,我们就可以用外生变量表示y2,这被称为约简型方程
外生变量的系数被称为约简型参数
约简型方程的误差被称为约简型误差
联立性偏误
当y2和u1因联立而相关时,称OLS存在联立性偏误(Simultaneity bias)
结构方程的识别和估计
联立方程组具有联立性偏误,不能用OLS,但是可以用2SLS
两个方程的识别
充要条件:秩条件((Rank Condition))
第二个方程中至少包含一个并不出现在第一个方程中的外生解释变量
保证了外生性变量中至少要排除一个外生变量
必要条件:阶条件(Order Condition)
受识别方程至少要排除一个外生变量
2SLS估计
一旦决定哪个方程被识别,就用2SLS估计,用任一方程中出现的外生变量共同构成工具变量
多个方程的系统
识别的阶条件
必要条件,对任何一个SEM中的方程,如果他排除的外生变量不少于其右端的内生变量数,则满足识别阶条件
秩条件
此处忽略
估计
无论SEM有多少个方程,每个可识别方程均可用2SLS估计,但是用三阶段最小二乘法更有效
第十四章:高级面板数据方法
固定效应估计法(FE)
原理
通过固定效应变换(组内变换)消除固定效应ai
模型构建
假定
1. 解释变量严格外生性条件下,FE估计量无偏
2. 可以容许ai与解释变量相关,但是uit应与所有解释变量无关
3. 若xit在时间上恒定,则减去均值后为0,不能放入该模型
4. uit具有同方差性和无序列相关性
虚拟变量回归
非观测效应ai对于每个i来说都是有待估计的参数
可以在原方程中加入每一个横截面观测的虚拟变量(N-1个),进而估计每个i的ai
固定效应还是一阶差分
当T=2时
FD和FE的估计值和统计量时完全一样的
当T>=3时
当uit无序列相关时,FE更有效
当uit有序列相关时(尤其是负相关),FD更有效
若T>N,FD仍能援引中心极限定理
若每个xitj都与uit无关,但是违背严格外生性,则FE偏误更小
非平衡面板数据的固定效应法
在一些样本数据集中,样本缺少了某些横截面单位的某些年份数据
如果是随机样本,则仍可正常使用FE或FD方法
随机效应模型
模型
与固定效应相比,这里引入了截距项β0
随机效应模型假定非观测效应ai与xitj不相关 (固定效应是假定非观测效应与解释变量相关)
如何估计
混合OLS
将yit对解释变量和时间虚拟变量做OLS回归,在随机效应假定下也能得到一致估计量
随机效应法(RE)
定义符合误差项
模型
vit包含了ai,所以是序列相关的
GLS变换与FGLS
相比于固定效应法直接减去均值,随机效应法则是减去均值的一定比率
当θ估计量为0时,便是混合OLS; 当θ估计量属于0到1时,便是随机效应法; 当θ估计量为1时,便是固定效应法
随机效应还是固定效应?
固定效应认为,ai与解释变量相关;随机效应认为,ai与解释变量不相关
普遍认为,FE更令人信服,但随机效应在特定情形中仍可使用(如不随时间变化的解释变量)
豪斯曼检验
同时使用FE和RE,再检验是否有显著差别
拒绝原假设则应该使用固定效应FE,否则使用随机效应RE
相关随机效应方法CRE
固定效应认为,ai与解释变量相关;随机效应认为,ai与解释变量不相关; 相关随机效应则对ai和xitj的相关关系进行建模
模型
意义
检验H0:γ=0来判断用FE还是RE
提供一个固定效应分析中包含不随时间变化解释变量的途径,加入γx均值后,可以自由添加不随时间变化的解释变量
把面板数据方法用于其他数据结构
有时不涉及时间的数据结构也可以使用面板数据方法,通常利用固定效应消除非观测聚类效应(Cluster effect)
第十三章:跨时横截面的混合:简单面板数据方法
跨时独立横截面的混合
跨时独立横截面可以加大样本容量
总体可能在不同时期有不同分布,可以通过设置年份虚拟变量来容许截距在不同年份不同(通常以最早的为基年)
还可以通过一个年度虚拟变量和某些主要解释变量之间的交互作用来考察这些变量的影响在某个特定时期是否发生变化。
对跨时结构性变化的邹至庄检验
方法一
把混合估计残差平方和看作约束SSR
无约束SSR则为两个时期分别估计而得的两个SSR之和
方法二
先将每一变量对两个年度虚拟变量之一形成交互作用,再检验这个虚拟变量和全部交互项是否联合显著
利用混合横截面做政策分析(DID)
关键假定
平行趋势假定
处理组和对照组具有相同的趋势
自然实验假定
当某些外生事件(如政府政策)改变了个体时,便产生了自然实验
分组
变化前对照组
变化后对照组
变化前处理组
变化后处理组
模型
两时期面板数据分析
固定效应模型/非观测效应模型
如何估计参数β
混合回归法
假定
非观测效应ai和特异性误差uit均与xit无关
原理
直接把两年的数据混合起来用OLS
一阶差分法(FD)
假定
原理
对于个体i,个体异质性ai不随时间变化,是一个常数(容许ai与xit相关)
通过差分消除个体异质性ai
模型
用两期面板数据做政策分析
面板数据对政策分析非常有用,特别是项目评估,用一阶差分法(FD)即可
多于两期的差分法
关键假定
严格外生性:特异性误差与每一时期的解释变量都无关
平衡面板数据
N个横截面单位都有同样的T期数据,就称为平衡面板数据
uit是序列无关的
如果时期T相对于N较小,则应控制时间虚拟变量
一阶差分面板数据的潜在缺陷
当Δx在不同时期变化不大时,此方法无效
若回归元并非严格外生,则FD估计量将不一致
若解释变量存在测量误差,则比混合OLS更糟
FD法下OLS假设
FD.1
对每个i,模型是:
FD.2
截面上为随机样本
FD.3
每个解释变量都随时间变化,且没有完全共线性关系
FD.4
FD.5
FD.6
FD.7
以xi为条件,Δμit是相互独立的同正态分布随机变量