导图社区 数量分析导图笔记
下图讲述了数量分析的知识内容,包含概率论、描述性统计学、假设检验、单元线性回归、多元线性回归、回归诊断、非平稳时间序列。
一张思维导图带你学习价值建模与估值,知识点有债券定价、期权定价、市场风险、信用风险、操作风险等,希望梳理的内容对你有所帮助!
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
数量分析
概率论
描述性统计学
随机变量
凸函数(convex) 函数的期望>期望的函数,凹函数(concave)相反
偏度(skewness) 左偏小于零(mean<median)
峰度(kurtosis)峰度>3(leptokurtic)
对变量X作线性变化后四阶距的变化(Y=a+bx)
均值
方差
Var(Y)=b²Var(X)
偏度和峰度
b>0,Y的偏度和峰度与X完全相同
b<0,偏度受b的影响,峰度不受ab的影响
常见分布
二项分布
泊松分布
正态分布
对数正态分布
if lnx is normally distributed, then X is lognormal distributed
卡方分布
检验单个样本的方差
t分布
偏度为0
不说高峰、低峰 之说 lsee peak than normal distribution
相比于标准正态分布,置信区间更宽
F分布
检验两个population的方差是否相等、以及多元联合检验中检验所有系数是不是都是0
多元随机变量
协方差(covariance)
corrleation
推断型统计学
sample moments
BLUE
Unbiasedness 样本方差等于总体方差
Efficiency 离散程度最小
Consistency n越大 估计得越精确
中心极限定理(CIT)
样本服从于正态分布
样本容量足够大时,样本均值等于总体均值
置信区间关键值
0.05→1.65
0.025→1.96
0.005→2.58
假设检验
Z检验和T检验
单、双尾?
p-value
decision rule:t检验的值在拒绝域外面、p-value比显著性水平α小
ERRORS
TYPE 1 拒真 P(type 1)=significance level(α)
第二种类型 存伪(β)
单元线性回归
OLS 的假设
线性回归假设
残差值的期望为0、方差恒定、自变量与残差不相关
自变量iid
不会出现域外值
decision rule
t> upper critical rule or t<lower critical rule
p-value less than α
confidence interval 包含 假设值
多元线性回归
描述统计量
ESS: explained sum of squares 均值与线性回归值的差
RSS: sum of squared residuals 真实值与线性回归值的差
cofficient of determination (R²)
TSS
adjusted R²
一定比R²小、可能为负值
只表示拟合程度,其与相关无显著关系
回归诊断
同方差性
异方差性
非条件异方差性(无影响)
条件异方差性(有影响)
残差的方差will increase(decrease) with increase(decrease) in the value of the independent variable
对回归系数无影响,影响假设检验 (使得t检验值过高,TYPE 1and2 ERROR
多重共线性
使t检验值过下,造成TYPE 2 ERROR
t不显著 F显著
VIF较高
缺省变量偏差( omitted
偏差与方差的权衡
low+low
low bias +high variance 过度拟合
high bias + low variance 欠拟合
high+high
散点图
高斯-马尔可夫定理:线性回归的假设都被满足了→ BLUE
平稳时间序列
时间序列三个描述量
trend(线性?非线性?)
seasonaity
cycles
协方差平稳
期望有限且恒定
方差有限且恒定
与时间段无关、与时间间隔有关
白噪声
0 mean、constant variance no serial correlation
残差如果服从正态分布→ 高斯白噪声
没有前瞻性、过去现在没有相关性
用卡方分布检验白噪声
置后算子(lag operator)
MA模型
express:current and lagged(滞后的) unobservable shocks
short memory regardless of parameter value
AR模型
express:its past values and an additive stochastic(随机的) shock
more persistent with larger parameter value
ARMA
均值回归
只有 AR/ARMA模型才有
非平稳时间序列
random walk
most important source of non-sationarith in economic time series
more dispersed over time 没有均值回归
unit roots
a generalization process of random walks(无均值回归!)
服从DF分布
检测使用Dicky-Fuller test
备择假设是γ<0
衡量收入、波动性、相关性
JB检验检验其是否是正态分布
属于卡方分布
相关系数
rank correlation (speraman's correlation)
Kendall's t
concordant anddiscprdant pairs (同序对和异序对)
线性关系下 linear correlations(pearson)和spearman差不多,kendall更低
在非线性关系下,rank和kandall更大
simulation and bootstrapping
variance reduction techniques
antithetic variate technique
complement of a set of random numbers and running a parallel simulation on those
control variates
employing a variable similar to that used in the simulatiopn, but whose properties are known prior to the simulation
bootstrapping
不做对分布的假设 directly uses the observed data
优点:不需要做假设 avoid the specification of a model
缺点:无法预测样本外的值
随着n增大 都趋向于标准正态分布