导图社区 定量分析思维导图
定量分析是对社会现象的数量特征、数量关系与数量变化的分析。下图梳理了线性回归入门、多元回归等内容,收藏下图学习吧!
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
Quantitative Methods
R4 Introduction to Linear Regression
1. 建模
1)Basics
Correlation coefficient (0: no linear relation, 1: perfect positive association)
名词以及解释
dependent variable
Independent variable
Intercept b0 & slope b1
2) Calculation and inerpretation
A. 公式法
b1
b1 : OLS思想:求 (一阶导=0)
b0
b0=Ymean-b1*Xmean
B. 计算机法
题中出现两组数据时候使用
(1)2nd,7
(2) 输入数据,enter, 下翻
(3) 2nd,8, 下翻得到a=b0,b=b1,r=
3) Assumptions(6个)
x,y
线性
x&残差项
rou=0
各个残差项
均值=0
方差稳定:homoskedastic (同方差)
随机分布
2. 分析
1) ANOVA
ANOVA table
SSE:真实y与预测y平方和
RSS:预测y与y均值平方和
TSS:真实y与y均值平方和
关系
TSS=RSS+SSE
自由度
TSS:(Y)n-1
RSS:(X)k
SSE: (残差项) n-1-k
Mean
各SS/df
2) R方:Coefficient of determination决定系数
公式
= RSS/TSS = 1-ESS/TSS
解释含义
0 《 R方 《 1
100%R方的x可解释y的变动的百分比,即拟合程度,越大越好,xy的correlation越大。
一元和多元中的区别
一元:
=预测与真实y的相关系数平方=xy的相关系数平方
相关系数r(xy)=R方开根号,b1决定正负号
多元:
=预测与真实y的相关系数平方
3) SEE and SSE
SEE
定义: standard error of estimate
分析:SEE越小,模型越好
SSE
定义: sum of squared errors
SEE=( ESS/(n-2) ) 开根
3. 检验
1) 参数估计b1
点估计
公式法求预测b1=真实b1
CI
b1预测+/-k b1预测标准差
lower S(b1预测)<=>lower SEE<=>higher R2
2)假设检验
(1)设假设
H0: b1=0; Ha: b1不等于0
(2)test statistic 计算
df=n-2
(3) 画分布
(4)判断
t落在拒绝域 <=> b1 significant
* p-value
越小越拒绝H0(vs alpha)
4. 预测
根据计算出的模型,用新x的值带入求y
区间估计
用预测y来估计真实y
CI:
y用方程求出
k查表得出
S 题中已知(当n很大的时候,Sy=SEE,自由度用n-1-k个)
5. 缺点
(1)change over time
(2)negate future usefulness
(3) have assumptions
R5 Multiple regression
1. 多元回归与一元回归的区别
区别1 系数的含义/解释
一元:x变动一单位,y变动几个单位
多元:当x2,3..不变的时候,x1变动一单位y变动几单位
区别2 假设检验
一元:一次t-test
k次t-test,每个系数单独检验
检验整个模型有效性:F-test
假设
H0: b1=b2=b3=0;Ha:至少一个bi不为0
F-statistics
MSR/MSE =(RSS/k)/(ESS/n-1-k)
查表
一个alpha对应一个张表,横(分子自由度k);纵(分母自由度n-1-k)
判断
F>k,接受Ha,模型作为整体有效
区别3 R2
(1) 解释
一元:整个模型/x对y的解释力度。
多元:整个模型对y的解释力度。
(2) 与r2的关系
一元:R2=r2(预测y,真实y)=r2(x,y)
多元:R2=r2(预测y,真实y)
R2的缺点
自变量越多,R2越大,每增加一个变量的边际贡献越低。
Adjusted R2
1- ESS/(n-k-1) / TSS/(n-1)
分析
R2》adjusted R2
K越大,R2越大越adjusted R2
当k非常大,adjusted R2可以小于0
2. Dummy variable
n-1个dummy variables
解释
系数反应:当季 return-未显示季度return (difference)
3. Assumption and violations
(1)x,y之间线性关系
(2)x非随机变量,x之间无线性关系
—> Multicollinearity(多重共线性)
(3)残差项均值为零
(4)残差项之间同方差(homoskedastic)
—> Heteroskedasticity(异方差)
含义
unconditional heteroskedasticity
残差项方差与x无关,不要紧
conditional heteroskedasticity
残差项方差与x有关系
后果
检验
修正
(5)残差项之间uncorrelated
—>Autocorrelation(序列相关,自相关)
(6)残差项正态分布