导图社区 CFA思维导图
CFA指特许注册金融分析师,是全球投资业里最为严格与含金量最高的资格认。下图讲述了统计与概率的知识内容,包括统计学基本概念、概率、概率分布、假设检验、抽样与估计。
编辑于2021-08-01 21:33:31统计与概率
抽样与估计
sampling
type
1. stratified random sampling
2. simple random sampling
先分组再简单抽样
Data
1. time-series data
如果期间发生了结构性变化,则有可能导致偏差
2. cross-sectional data
error
1. data mining bias
统计学上有显著性不等于有经济理论支撑
2. sample selection bias
surviorship bias
幸存者偏差
3. look-ahead bias
使用了尚不可获得的数据来预测
4. time-period bias
只能在特定时间内成立,没有推广到所有时期
estimate
point estimate
利用估计量来估计总体参数
Desirable properties of estimator 估计量的评判标准
unbiasedness
统计量的期望值等于总体参数
efficiency
无偏样本统计量中,方差最小
consistency
样本容量增大时,样本统计量逼近总体参数的概率上升
用样本均值来估计总体参数最优
Central limit theorem
对统计量均值的概率分布进行描述
条件
n >= 30
总体的均值,方差为已知且有限
为简单随机抽样
结论
样本统计量均值服从【正态分布】
样本统计量【均值】为总体【均值】
样本统计量均值的方差
样本统计量均值的标准误 standard error =
注意区分【标准差】与【标准误差】
confidence interval estimate
衡量点估计给出的估计数值的可信程度
5%显著性的置信区间 = 95% 置信度的置信区间
置信因子的选择 Z分布(均值0,方差1) & T分布(用样本的方差来代替)
假设检验
步骤
null hypothesis & alternative hypothesis
确定统计量
样本均值标准化后服从正态分布
significance & critical value
关键值是判断是否拒绝原假设的临界值
two-tailed test & one-tailed test
其检验统计量均相同,主要区别在拒绝域
p-value
拒绝原假设的最小显著性水平
则,拒绝原假设,反之亦然
Type 1 error & Type 2 error
决策
statistical signigicance & economic significance
正态总体的假设检验
均值
单个
与某个常数进行对比
根据情况选择 z检验 或者 t检验(自由度n-1)
两个
相互独立
方差未知,假设 【方差1】与【方差2】相等
自由度为 n1+n2-2
方差未知,假设 【方差1】与【方差2】不相等
自由度非常复杂
paired comparison test
检验是否存在某种关系
抽样为两个样本当中均值相减, n1-m1=U1, U1=U0, U1不等于U0, U0通常为0
采用 t检验,自由度为n-1
相关系数
p=0, 没线性关系, p不等于0, 存在线性关系
(-1 ~ 1)
服从 t检验,自由度为 n-2,因为有两个变量
方差
单个
是否等于某个常数
卡方统计Chi-Square
自由度为 n-1
两个
两个方差是否相等
F分布, 自由度为 n1-1, n2-1
方差大的为分子,第一个自由度为分子的。因此,F值为>=1
参数检验与非参数检验
参数
都与总体参数相关
都假定总体服从某种特定分布
非参数
总体分布未知,样本数据也不服从特定分布
按照等级rank分类都数据,无法加减乘除
不涉及总体参数
概率分布
连续型随机变量
取任意一单点都概率均为0
probability density function PDF; 在概率密度函数当中,关注的是某一区间的值
累积分布函数cummulative distribution function CDF
有界限的
离散型随机变量的应用
bernouli distribution
做了一次实验,只有两种结果
binomial random variable
做了多次实验,只有两种结果
结果都是独立都,概率一样
连续均匀分布
shortfall risk
是一个概率
Roy's safety-first ratio
比值越高越好
当Shorfall risk R等于无风险利率R时,SF ratio就是 Sharp ratio
Lognormal distribution
描述资产价格
非负数
正偏(正态分布右移)
随机变量服从正态分布,则对数x也服从
t-分布
小样本推测总体
df=n-1
置信区间比正态分布宽
低峰肥尾 均值=0,方差>1,峰度>3
multivariate distribution多元分布
多个资产
3个参数:每个资产的均值,方差,不同资产间的相关系数
假设n个资产,相关系数为
monte carlo simulation
假设r服从正态分布,对r的可能取值进行取样,然后进行模拟,得出最终概率,再进行情景分析
缺点:复杂,如果假设不正确,得出的结论也不正确
historial / back simulation
根据过去历史数据来预测
缺点:如果有结构性改变,就难以准确,毕竟是历史数据
概率
odds
joint probability
P(AB) = P(A|B)*P(B)
Addition rule
P(A or B)=P(A)+P(B)-P(AB)
total probability rule
互斥且遍历
P(成功)=努力复习成功90% * 80% + 不努力复习成功10%*10%
Bayes' formula
因果互推
修正概率,当有新信息
期望 E(x)
随机变量都方差其实也是一种期望
covariance
两种资产间都变化方向
cov=0时,不存在线性关系
取值为负无穷到正无穷,不考虑量纲
correlation
(-1 ~ 1)
<0 负相关
>0正相关
绝对值越大,相关性越明显
=0没有线性关系
排列与组合
有顺序
无顺序
统计学基本概念
四种measurement scales
nominal sale
男,女
ordinal sale
第一名,第二名
interval scale
一年级,二年级
ratio scale
考试得99分
两种常用表示频率的图
histogram
frequency polygon
中心趋势
均值
arithmetic mean
geometric mean
衡量多期资产平均收益率
harmonic mean
定投的平均成本
weighted mean
median
n为奇数
(n+1)/2
n为偶数
n/2 与 (n+2)/2的平均值
mode
频率最高
一个
unimodal
两个
bimodal
三个
trimodal
不存在
数据都不相等时