导图社区 FRM定量分析总结
这是一篇关于FRM定量分析总结的思维导图。该导图介绍了其概率论、随机变量和距、假设检验以及线性回归等内容。
编辑于2021-07-26 21:17:13定量分析
概率论
事件
互斥
互斥一定不独立 独立不一定不互斥
独立
完备
运算
乘法
P(AB)=P(B)P(A|B)=P(A)P(B|A)
加法
P(A+B)=P(A)+P(B)-P(AB)
全概率
贝叶斯公式
边际概率
条件概率
随机变量和距
随机变量
连续型随机变量
在确切一点的概率为0 一段的概率即求积分
p(a<x<b)=F(b)-F(a)
p(x>a)=1-F(a)
CDF
非减
加速上升f'(x)>0 减速上升f'(x)<0
F(-∞)=0,F(+∞)=1
离散型随机变量
PMF,CDF
分类
数字特征
期望(一阶原点矩)
性质
6点
方差(二阶中心距)
计算
性质
4点
偏度(标准化的三阶距)
衡量极端风险
左偏/负偏
s<0,均值<中位数<众数
右偏/正偏
s>0,众数<中位数<均值
对称/无偏
s=0,众数=中位数=均值
峰度(标准化的四阶距)
衡量两端厚尾的程度
尖峰
k>3,肥尾
无峰
k=3,normal
excess kurtosis=k-3
低/平峰
k<3,瘦尾
分位点
衡量分散程度
累积概率的反函数
中位数
分位区间点/分位区间差/分位差(IQR)
Q75%-Q25%
众数
概率分布
表达式 图像 数字特征 特殊性质
离散型
二项分布
多重伯努利分布/两点分布
通常用于计算违约概率
泊松分布
n比较大,p比较小
均值=方差=λ
注意时间
连续型
均匀分布
注意所求概率的两端是否在定义域内
正态分布
X~N(μ,σ²)
CDF斜率越小,方差越大
方差越大,图形越分散
置信区间
置信水平68%,μ±σ
90%,μ±1.65σ
95%,μ±1.96σ
99%,μ±2.58σ
置信水平+显信度=1
标准正态分布
N(0,1)
标准化过程
求概率Φ(z)=Φ(-z)
特征
对称
渐近线
定义域(-∞,+∞)
对数正态分布
针对底层资产
右偏
3个性质
卡方分布
多个z分布的平方和相加
均值=自由度,方差=2倍的自由度
3点性质
t分布
均值为0
肥尾
3条性质
F分布
y~t分布,y²~F分布
n1=1,n2比较大时,F分布趋近于卡方分布
子主题
指数分布
计算违约概率
期望=β,方差=β²
CDF pdf
子主题
β分布
定义域(0-1)
混合分布
权重相加 =1
多变量概率分布
概率矩阵
边缘分布
条件分布
边缘概率
联合概率=边缘概率相乘,则两个变量独立
数字特征
期望
协方差
定义式
2种:推导过程
Cov>0 同向 Cov<0 反向
特殊形式就是方差
-∞<x<+∞
相关系数ρ∈[-1,1]
完全正相关ρ=1,完全负相关ρ=-1
独立一定不相关
ρ=Cov(x,y)/σxσy
性质
3条性质(包含3个推导)
协方差矩阵
协峰度协偏度
条件期望/方差
独立同分布
E(∑x)=nμ
V(∑x)=nσ²
s.e.=σ/(n^½)
有相同的距
方差呈线性增长
估计距
估计均值/方差
定义式
性质
偏差
有效性
BLUE
点估计
区间估计
无偏性 有效性:方差越小越有效 一致性:估计值低概率收敛为真实值 线性
含义
大数定律、中心极限定理
大数定律
n≥30
样本统计量趋近于整体
变量是独立同分布,μ≡E(xi)
中心极限定理
变量是独立同分布,方差确定存在
s.e.
总体方差已知
总体方差未知
构造Z/t分布
假设检验
置信区间
双尾计算方法
σ已知,n≥30:z分布
σ未知,n<30:t分布
σ未知,n≥30:两者均可
σ已知,n<30:z分布
单尾计算方法
假设检验
只能证伪
单尾检验
H0:μ≥μ0 Ha:μ<μ0
H0:μ≤μ0 Ha:μ>μ0
双尾检验
H0:μ=μ0
Ha:μ≠μ0
统计量
z统计量
t统计量
整体过程
1.设置原假设 2.查表 3.构建统计量 4.23两值做比较 5.拒绝或不拒绝原假设
对方差检验
卡方检验
F检验
影响
n:变大,置信区间变小,精确度变大,变化为原来的(n2/n1)
σ:变大,置信区间变大
α:变大,置信区间变小
两类错误
type 1:拒真
type 2:存伪
P-value检验
线性回归
一元
Y=α+βx+ε
回归分析
只代表相关性,不代表因果性
OLS
假设
4大点
假设可能违反的情况
4种
参数估计
α
β
假设检验
H0:β=0
T~t(n-2)
置信区间
哑变量
多元
假设
6点
模型合适程度
SSR
ESS
TSS
R²
k↑,R²↑
R²不能进行比较
无法评判R²的好坏
R²=ESS/TSS=1-RSS/TSS ESS+SSR=TSS R²=ρ²
修正拟合优度
2个计算方法
K↑,Adjust R²↓
假设检验
H0:b1=b2=……=bn=0
构造F检验
单尾检验
单个检验t检验
违反回归假设
遗漏变量偏差
外来变量
偏差-方差替换效应
变量选择的两种方法: 1.GtS(一般到特殊) 2.m-fold
异方差
不会影响系数的一致性和无偏性,影响s.e.
解决方法:怀特检验
H0:γ1=γn=0
构造t统计量nR²~卡方分布k(k+3)/2
拒绝原假设即存在异方差
t检验、F检验均失效
检测方法:散点图
多重共线性
F检验显著,t检验不显著
outlines
时间序列
平稳时间序列
协方差平稳
定义
平稳时间序列:三个要求
好处:可预测
ACOF&ACF
自相关定义:ρh=γh/γ0
自相关函数ρ|h|
偏自相关函数
白噪声
εt~WN(0,σ²)
任意两个自相关过程不相关
特殊类型:高斯白噪声
检验方法
Box-Pierce
构造的是卡方分布
χ²(n)>χ²()
Kjung-Box
AR,MA,ARMA
AR模型
AR(1)表达式
|Φ|<1时2点性质
PACF结尾,ACF拖尾
MA模型
MA(1)表达式
2点性质:E(Yt)、V(Yt)
ACF结尾,PACF拖尾
ARMA模型
ARMA(1)
ACF,PACF均拖尾
检验模型
S²
AIC
MSE
SIC
非平稳时间序列
线性和非线性的时间趋势
如何拟合季节性影响
单位根
计算
波动率和相关性
简单和连续的复利
简单收益率
连续:对数收益率
log return <simple return
波动率
σannual=(252σ²daily)½
VIX指数
JB检测和power low法则
JB
H0:S=0 and k=3
研究尾部
检查尾部自然对数
图像法
power law
P(X>x)=kx^(-a)
相关性
ρ=Cov/σxσy
斯皮尔曼相关性:两个优点
鲁棒性对于离群值
对数值本身排序无影响
公式
Kendall's τ
一致性
非一致性
公式
蒙特卡洛模拟和拔靴法
蒙特卡洛模拟
DGP过程
过程
PRNGs:可重复使用
依据:大数定律,中心极限定理
限制
4点
拔靴法
重新放回的重新抽样
iid Bootstrap
CBB
失效情况
依赖现实情况
结构变化
离群值
二者比较
蒙特卡洛模拟对分布需要严格假设
拔靴法需要现实数据
都会遇到黑天鹅事件
不重要
次重要
重要
备注
0-1分布