导图社区 概率论与数理统计-考研思维导图
概率论与数理统计-考研思维导图,整理了随机事件及概率、一维随机变量及其分布、二维随机变量及其分布、数字特征等内容,可用于考前冲刺!
编辑于2023-03-05 23:18:49 江苏省概率论与数理统计
22/9/24]```对去年不完善内容进行修改,增加全部公式```21/10/9]```基础内容高频考点更新完毕假设检验和无偏估计暂时不急```21/11/30]```概率论与数理统计是两个部分,概率论是反映的理论性[抽象性]的概率计算,概率论即一种将事件映射到数轴[随机变量],再有数轴点集合计算概率[分布律]数理统计则是更多的讨论抽样调查[真实性],在以估计检验等方式对事件真实概率进行预计。```
前置
条件关系
充要条件
集合关系
二项式性质
随机事件及概率
概念
随机实验
简称 实验
相同条件,实验可重复进行
所有可能结果已知
实验具体结果未知
样本点
随机实验的每一个基本的**可能结果**
样本空间
样本点全体组成的集合
事件
明确运算规则,能够将文字描述内容转化为事件符号逻辑
类型
随机事件
样本空间的**子集**,常用大写字母A,B,C,...表示若实验出现 样本点属于A,则称A发生;否则称为A不发比如:掷骰子,点数有6个独立样本点1、...、6(两个不同点数不能同时发生)总样本空间即为所有样本点的集合(1,...,6)设事件A为一次投掷的点数小于3,那么A所代表的样本空间记为(1,2)
必然事件
全集,每次实验中必然会发生的事件当事件的样本集等于全集时,则必然发生
不可能事件
事件为空集,则每次试验都不可能发生例如:投骰子(只有1至6的点数),投出个7来
事件关系
集合关系表示
子事件
子集合关系【吸收律】
子事件
相等
并事件
交事件
差事件
互斥事件
对立事件
事件运算
交换律
结合律
吸收率
分配律
德摩根定理【对偶率】
事件表示
假设表示设事件A表示为...
表示事件/表示变量设A某某事件"由i次发生",【条件概率】记某某事件A发生次数为X【概型】
【不然改卷老师不知道A,B,C表示啥】
集合表示某事件0,(x,y)\in \Omega\}" contenteditable="false">
概率
注意理清楚概率性质与事件性质之间的联系和区别概率时公式求得的数值,所以可以进行加减乘除运算而事件本身是一个集合,所以属于集合运算逻辑两个不同概念之间的联系,或许也就是数学抽象逻辑的魅力(算数和代数)。
公理
非负性
规范性
可列可加性
性质/公式
概率括号内部满足事件运算律外部则是数值运算,加减乘除
规范性/非负性
两两互不相容事件可加【可列可加性】
概要
大量随机变量的和服从或近似服从正态分布
求逆公式【对立事件】
至少、最多[对立的关键字,利用补集求解]
注意区别
概要
随机变量平均 依概率收敛于 总体期望
减法公式【差事件】
线性运算
加法公式【容斥定义】
三事件加法【三容斥】
吸收率
德摩根定律
概率不等式
概率与事件关系
充分非必要】概率无法推出事件(包含、相等、互斥)概率的结果不能反推理事件结果,例如概率为0的事件,可能发生,也可能为不可能事件心得」其实就是一种映射关系,X(事件)对应 f(X)概率 「一一对应」,概率对应多事件,因此不存在从事件到概率的反函数.
概型
古典概型
定义有限样本点,且样本点发生可能性相同
样空间为有限集合
公式
推论【N件产品有M件次品,取n件,恰有k件次品概率】
枚举法求概率
加法/乘法原理
加法即独立方法
乘法即步骤顺序
排列/组和
排列
事例理解]排列5种不同水果至10个不同位置则随机选择一种,第一个有十种位置可选(确定一个)接下来只剩九个位置,最后放完*
组合
忽略掉顺序关系
递归求解组合结果
阶乘
几何概型
在求解几何面积时会结合定积分求面积
定义样本空间中无限样本点构成的几何区域(长度、面积、体积等),且样本点等可能发生
公式
条件概率/乘法公式
定义已知A发生条件下B发生的概率,记为P(B|A)
注意理解B的含义
公式
常用性质【前提P(B)>0】
实际上我们可以把概率性质看作 B=Ω 情况下的条件概率【公式一致】,就像 e^x 与 a^x 之间关系一样
[0,1]范围
规范性
求逆
注意: 不是
加法公式【容斥性】
减法公式
如果A,B独立
可列可加性
乘法公式
0}【P(A)P(B|A)】\underrightarrow{P(B)>0}【P(B)P(A|B)】" contenteditable="false">
全概率公式/贝叶斯公式
全概率公式【无数现实之和=真理】
贝叶斯公式【已知结果求路径概率】
结论【抓阄原理】
完备事件组0 \\ 2) A_i \cap A_j=\empty(i\neq j)" contenteditable="false">
伯努利概型
定义
n重伯努利实验
事件独立性
定义
相当于 未知数 x,y 是独立未知数,没有函数关系计算A事件概率就和B事件没半毛钱关系
独立定义
互斥定义
A 发生则 B 必然不发生,反之亦然
重要结论
与 独立,则 与 对立, 与 对立, 与 ,均相互独立
概率为 0 的事件以及概率为 1 的事件与任一事件均相互独立
独立条件下,条件概率只与子事件有关
A,B,C 两两独立
A,B,C 相互独立
设有 n(n>=2) 个随机事件 A1,...,Am ,如果对其中任 k 个,均有
事件独立性标志"互不干扰","互不影响","有放回取球"
独立互斥关系
没有直接联系
独立重复实验
相当于n重伯努利试验
独立重复实验,"第n次实验刚好是事件第k次发生"
一维随机变量及其分布
22/9/15调整格式,增加分布函数计算公式
随机变量
随机变量相当于把事件转化为数,在数轴上进行表示,一种映射函数事件 -> 数值, X = X(ω)
定义
事件表示
分布函数
计算 事件所对应的数值集合 的概率F( X )=F( X(ω) )=P{X ≤ x}
定义
可以理解为,事件的集合发生在数轴值为x的左侧(包括该点本身).对于有限样本集,则其函数映射必然是离散的,而无限样本集则可能是连续。
性质
域 / 规范性
任意分布函数的隐藏条件
单增
右连续
计算
注意概率函数的边界问题,什么时候间取该点的概率,什么时候不需要减去
基本公式
x\}=1-F(x)" contenteditable="false">
反函数
复合运算
分布函数的线性组合仍为分布函数【系数和为1,保证概率规范性】
分布函数的乘积
密度函数的复合运算
经典错误
注意函数的右连续性质
离散型随机变量
在以前的各种概型,都是讨论的等概率密度的条件下的数学模型,而对于概率密度不相等的却没有进行研究。所以随机变量的引入便是为了更好用函数形式来研究其概率的密度以及分布情况【图形】
定义
X的取值为有限或可列无穷多个
概率分布 / 分布律
离散型随机变量使用概率分布律描述每个离散点概率连续性随机变量使用概率密度函数来描述每个连续点的概率
表格形式
分段函数【离散】概率分布在分段点位置
公式形式
分布律性质
常见类型
分布主要是争对分布律函数的研究以及命名而概型则是争对不同场景提出的数学模型
0-1分布
伯努利概型
二项分布 Binomial Distribution
独立重复实验
泊松分布 Poisson Distribution
泊松分布本质是二项分布,不过其概率密度化为连续性。
泊松定理
用于估算二项式
条件
推理记忆
级数
期望
高数结论【级数】
几何分布
定义】独立重复实验中,事件A首次发生时所进行的实验次数 x[**直到第n次才发生的概率**],服从几何分布"几何"名称】**几何分布和几何概型**不是同一件事命名原因】几何分布即是分布各项构成等比数列,每一项都是前后两项的几何平均数
超几何分布
在古典概型中,事件A首次发生时所进行的实验次数X,服从超几何分布称为超几何分布,是因为其形式与“超几何函数”的级数展式的系数有关。
连续型随机变量
定义
连续性分布函数不连续的随机变量,一定不是连续性随机变量
概率密度性质
非负性
规范性
概率密度为偶函数
f(x)连续点处
分布函数
概率为0【极限】事件未必为不可能事件,但不可能事件概率必定为0
事件端点不会影响区间概率【注意与离散型随机变量之间的区分】
常见类型
均匀分布 Uniform Distribution
概率密度
分布函数
右连续性决定区间范围
对称轴\frac{a+b}{2}\}=P\{X
区间概率
可以记作落在x坐标轴上原范围在[a,b]区间的概率相等,总概率之和为1所以在[c,d]区间的概率,就是d-c/a-b 长度之比【几何概型-线段长度】
指数分布 Exponential Distribution
如果某一事件在特定时间间隔(0,t)内发生的次数服从泊松分布(λt),则该事件先后两次发生之间的时间间隔服从指数分布(λ)
概率密度0 \\0,x\leq0\end{cases}" contenteditable="false">
分布函数
本身在0点连续,但是由于要体现右连续性,所以这样划分区间
证明:x\}/h=\lambda" contenteditable="false">
假设分布函数
化简为
求解
无记忆性【区间长度相等概率相同】s+t|X>s\}=P\{X>t\}=e^{-\lambda t}" contenteditable="false">
即,如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时的概率相等
正态分布 normal distribution
又称为高斯分布【不过Gauss不是第一个提出人,但是用的好,自己又是大牛人,所以就把这命名给他了】推荐[ 靳志辉 - 正态分布的前世今生 ](https://cosx.org/2013/01/story-of-normal-distribution-1/) 对正态分布来源地科普
密度函数
[正态分布概率密度证明](https://zhuanlan.zhihu.com/p/52808762)记忆时候可以这样想首先由于这个式子是由常系数微分方程推导出来的,所以带一个 e^x由于方差 σ 越小图像的高度越高,所以肯定与 σ成反比,同时又和圆相关(具体见证明步骤)【1/[sqrt{2 Pi}σ]】由于后面含指数,同时方差决定胖瘦,所以,在指数部分 与方差成反比,同时由于对称性所以包含 (x-μ)^2的函数所以就得到 e^[-(x-μ)^2/2σ^2]
分布函数
性质
标准态分布
概率密度
分布函数
分布函数关于X=0对称
利用标准正态分布求解
概率区间标准化求解
比较不同正态分布概率大小
图形性质
对称轴
对称性\mu\}=P\{X
离散程度 越小,分布越集中,图越高越瘦,反之越分散,又矮又胖
标准正态
即位于U_α 右侧概率面积为 α
复合变量【原理:方差和均值公式】
高数结论
随机变量函数分布
离散型
利用分布律求解
如果一个Y对应多个X,则Y的概率为满足条件的所有X的概率之和
连续型
公式法
设y=g(x)为单调、导数不为0的函数,h(y)为其导函数```概率密度不能为负,所以h'(y)需要加绝对值```
定义法
使用公式法时条件要求较多:单调、可导、导数不为0、反函数存在,
通用型
分布函数的线性组合仍为分布函数【系数和为1,保证概率规范性】
分布函数的乘积
密度函数的复合运算
常见题型
练习
分布函数/概率密度基本概念
分布中待定参数求解
一维连续型随机变量
常见分布
函数的分布
真题
二维随机变量及其分布
可以和一维随机变量分布比较,实际上也就是高数中一元函数到多元函数概念的扩展从一个函数映射到一维数轴上,变为向整个平面域进行映射
定义
n 维随机向量
一个事件具有n个属性,不能缺少
【(X,Y)的联合分布函数】
1.定义域为全平面2.几何意义上F(x,y)表示落在点(x,y)左下角无穷矩形的概率[包括右边界和上边界]
边缘分布
条件分布0,P\{y-\xi0,则\lim_{\xi\rightarrow 0^+}P\{X\leq x|y-\xi
性质
性质为题干中所自带的隐性条件
边界 / 规范性
单调性x_1,y_2>y_1】" contenteditable="false">
右连续
面积差分公式
离散型随机变量
二维相对一维由于多引入了一个轴,所以将分布律分为 联合概率分布、边缘分布律、条件分布律进行讨论
概率(联合)分布律
矩阵表格
性质
书写格式
矩阵法
枚举法
边缘分布律
类似随机事件里面的 **全概率公式**
性质
条件分布律
**条件概率公式**
连续性随机变量
联合分布函数
联合概率密度
非负性
规范性
全平面连续
连续点处概率密度 = 分布函数二阶混合偏导
计算
设 D 为 xOy 平面区域,则点 (X,Y) 落在点 D 内的概率
边缘密度函数
把二维化为一维
求X边缘密度,把X=x,对于的 y 积分成一根线的密度
求Y边缘密度,把Y=y,对于的 x 积分成一根线的密度
条件概率密度
0)条件下,X的条件概率密度\\f_{X|Y}(x|y)=f(x,y)/f_Y(y),-\infty
性质
非负性
规范性
随机变量独立性
定义
结论
判断
求出对应X,Y的边缘分布,再通过定义【充要条件】,进行判断
二维均匀分布
一维均匀分布表示点在整个区间线段的的概率是相等的,所以就是 1/L【长度】,而对于二维均匀分布而言,某个面积的每个点的概率相等,所以每个点概率即为 1/S【面积】
概率密度
D是G的一个子区域
二维正态分布
公式不需要记,但是要知道其对应的 期望/方差性质
正态分布
(X,Y)的正态分布性质
(X,Y)二维正态则X,Y均正态
反之不一定
(X,Y) 正态,当,则 (aX+bY,cX+dY) 也正态
(X,Y) 正态 ,对任意常数 a 与 b, 时,aX+bY 必正态
X,Y均正态且独立,则
简单函数分布
二维离散型
组合枚举法,和一维离散类似
泊松分布
二项分布
二维连续型
与上面讨论内容不同点在于,当有某随机变量Z是关于g(X,Y)随机变量关系时,怎么求解若Z是离散型,那么就对应求出其分布律即可;而如果是连续性,则先求出分布函数,再求分布概率;如果既不是连续型又不是离散型那么就只求出Z的分布函数
分布函数法
难点在于要对变量z进行分段讨论,导论分段点为Z=g(X,Y)的最小值
分布函数
概率密度
公式法
当 X,Y 独立时
独立同分布
多维独立随机变量
X,Y 独立同分布时
指数独立同分布 X,Y ~ E(λ)
多维独立随机变量
指数分布
看作对 Z=X+Y 区域的限制
解法】二重积分,换元、交换积分次序
X 和 Y 相互独立时【卷积公式】
正态分布
随机变量相互独立
题型
练习
求分布函数的参数
利用规范性、右上连续性、底边界值为0
已知X,Y的分布律,以及某关系,求其联合分布律
有点类似数独游戏,把有已知的概率部分求出来,加上某行或者某列的和对应其边缘分布,然后填空即可。
真题
数字特征
数学期望
定义
离散型随机变量期望
一个加权平均数
连续型随机变量期望
收敛,记为 或
函数期望
一维随机变量
复合离散随机变量
sp:
复合连续型随机变量 【f(x)为X的密度函数】
sp:、|X|
二维随机变量
离散
sp: ;
连续
性质
期望是求和公式的极限,所以对于以下线性运算当作求和的'交换律/结合率/分配率'进行计算
线性运算可拆性
一般情况
独立随机变量【充分条件】
独立 (完全无关联) -> 不相关 (无线性关联)
一般情况
加权平均不等式
方差
定义
方差是一个特殊的期望
定义【前提D(X)存在】
DX相对于EX,可以理解为,将E()函数中的参数X替换为(X-EX)^2
计算公式
把DX=E[(X-EX)^2]的参数拆开就可以得到
推理记忆 1. E(X) 是一个数 2. 利用期望线性运算
随机变量平方的期望=原方差+原期望的平方
性质
常数方差为 0
用方程几何意义也可以知道:方程主要表示 每个值与期望之间的误差关系,而常数完全一根平行线,所以 0 误差
稍微思考下方差的公式就知道为啥了
多维变量方程
协方差
随机变量 X,Y 独立
常见分布的期望/方差
一维离散型随机变量
0-1分布
公式
证明
证明
二项分布
证明
二项式定理
泊松分布
期望公式
证明
级数公式
方差公式
E(X^2)
D(X) = E(X^2) - [E(X)]^2
几何分布
公式
证明
级数公式
1/(1-x) (-1
E(X^2) 【中间证明又涉及级数,此次省略】
一维连续型随机变量
均匀分布
期望为线段 [a,b]的中点 (a+b)/2
E(X^2)
指数分布
期望公式
证明
方差公式
正态分布
正态分布的记号 μ和σ便是对应的该分布函数的 期望和方差
期望公式
证明
方差公式
证明
E(X^2)的计算方式和其期望计算方法类似,换元以及分部积分可得
性质
标准正态分布随机变量关系
独立正态的线性组合仍时正态分布【μ和σ^2同时线性组合】
二维正态分布
定义
随机变量函数
求解期望
求解方差
求解协方差
协方差
定义
利用期望求解
证明
利用 相关系数/方差 求解0】" contenteditable="false">
性质
相关系数
定义
0】" contenteditable="false">
性质
范围绝对值为1
X 与 Y 不相关 ≠ 独立
相关系数 |ρ| = 1 充要条件0\\-1,a
(X,Y)服从正态分布,此时等价
矩
[矩概念形象的类比理解](https://www.zhihu.com/question/19915565/answer/233262673)
k阶原点矩
k阶中心矩
k+l 阶混合矩
随机变量标准化
数字特征与独立性
独立,则协方差 = 0
独立必然不相关,而协方差Cov描述变量相关性
大数定理和中心极限定理
用于估计概率值
依概率收敛与大数定律
依概率收敛
定义
利用数列极限定义式,有随机变量序列,当序列最后稳定在a的极小邻域内的概率极大,为1这就给大数定理一个理论依据,有无限的样本时,最后平均结果会稳定在期望【利用概率的形式表示收敛性】
记为
大数定理【条件不背】
矩估计的依据
切比雪夫大数定理
两两不相关随机变量序列,均存在,存在常数C, 0 \lim_{n\rightarrow \infty} P\{| \frac{1}{n} \sum X_i-\frac{1}{n} EX_i |\leq \xi\}=1" contenteditable="false">
伯努利大数定理
随机变量 0, \lim_{n \rightarrow \infty} P\{| \frac{X_n}{n}-p | \leq \xi\}=1" contenteditable="false">
辛钦大数定理
独立同分布 0 \lim_{n \rightarrow \infty} P\{| \sum X_i-\mu | \leq \xi\}=1" contenteditable="false">
中心极限定理
独立同分布列维 —— 林格伯格定理
正态分布为极限分布棣莫弗 —— 拉普拉斯极限中心定理
切比雪夫不等式
公式
形象记忆
数理统计的基本概念
总体
总体是指,与所研究的问题有关的对象的全体所构成的几何。总体就是服从某概率分布的随机变量X其概率分布称为总体分布
样本
定义
样本值 / 观察值为观察值【抽样后】
样本 / 简单随机变量为n维随机变量【抽样前】
前提条件相互独立且与总体同分布
样本数字特征性质
Xi 与 X同分布
统计量
定义
不含任何未知数样本不含任何参数的函数
数字特征
样本均值
样本方差
[为什么会是 方差是除以 n-1 而不是 n?](https://zhuanlan.zhihu.com/p/115184696)注意区分样本方差和总体方差概念的区别样本永远是用来估计整体的统计学家利用无偏估计代替有偏估计```1/n 符合常识,但是会导致所有计算的样本方差会≤方差,而 1/ (1+n) 则会适当放大样本方差,使得更好的与方差拟合```
样本标准差
样本 k 阶原点矩
样本 k 阶中心矩
顺序统计量
结论
正态分布方差
上侧分位点
代表大于这个点的概率等于α
定义
理解
分布
近似正态分布多维随机变量的正态分布
卡方分布
定义
条件【独立变量必须服从标准正态分布】
自由度为n的卡方分布
性质
期望、方差
可加性
证明
方差
上侧 α 分位点
\chi_\alpha^2 (n)\}=\alpha" contenteditable="false">
t 分布【student分布】
条件
定义
性质
分布具有对称性
上侧 α 分位点
F 分布
定义
n_1第一自由度,n_2第二自由度的 F分布
性质
当 n1,n2 为 1 时
上侧 α 分位点
单正态总体的抽样分布
前提
结论
注意是关于n-1自由变量的卡方分布
注意是关于n-1自由变量的t分布
证明
结论2
双正态总体的抽样分布
前提
参数估计
基本概念
点估计
定义
点估计定义构造一个统计量 用来估计总体X分布中含有的未知数
总体未知参数
例如求所有中国的身高平均数由于人太多,且同时都有新出生的,就难以做到实时更新人口数据。而这个总体未知参数就是确定的,但我们不知道的值
统计量
对于总体未知的值,我们就想要采取某种样本分析方法,取估计实际的未知值,因此提出统计量这一概念
无偏性
无偏估计
定义设为的估计量,若,则称 的无偏估计.,称为渐近
结论
样本与总体 的无偏估计
的无偏估计,
估计量均为 的无偏估计,则其线性组合任为无偏估计
更有效估计
有两个无偏估计量 和 , 当 比 更有效
一致估计
其中 依概率收敛于 则称其为 的一致估计量
估计量/值
估计量随机变量
估计值所取的具体值
点估计估计量的值估计未知参数
估计方法
矩估计
总体矩
一阶原点矩=期望 ,二中心阶矩=方差
原点矩对应 (x-0)f(x)中心矩对应 (x-μ) -> (x-EX)
样本矩
均值,和样本方差
关系 / 定义
求k个参数需要用到k个方程,就需要利用到一阶矩到k阶矩的方程
基于 大数定律 利用 样本矩 估计 总体矩
1) 对于总体 的分布含有, 有 存在,则显然为关于 的函数
2) 则样本k阶原点矩为
矩估计量表示
最大(极大)似然估计
似然函数
由于所有的随机变量都独立,所以概率可以直接相乘【独立随机变量的概率定义】
样本取得观察值的概率
离散型
连续型
由于连续性在某点的概率为0,所以我们只能通过其领域微分结果来估计
求解
思路】在未知参数 取值范围求,简言之就是求函数的最大值点 , 使得值最小,成为最有效估计量
步骤
写出对应函数,取对数【对数求导法】
求出唯一驻点,
多个参数则求偏导
若方差无解,则取端点或边界,需要根据具体情况分析
区间估计
置信区间
定义
设 是总体 的未知参数, 是来自总体 的样本,对于给定的 , 如果两个统计量满足 则称随机区间为的置信水平(置信度)为 的置信区间(区间估计),简称为 的 置信区间,分别成为置信下限和置信上限
正态总体参数的区间估计
假设检验
假设检验
[人话版 Hypothesis Testing(假设检验)](https://zhuanlan.zhihu.com/p/31322539)
假设检验
对总体分布中某些未知参数作假设,然后抽取样本,构造合理统计量进行正确性判断
小概率原理
小概率事件在一次实验中基本上是不会发生的又称“实际推断原理”
原假设与备择假设
原假设H0 , 备择假设H1 为问题**对立**的两个方面 [两个相反假设]
两类错误
第一类:弃真错误
原假设 H0 为真,但检验结果为拒绝 H0翻译】原来假设的真理,被一个反例给直接推翻了。所以这个假设绝对错误
第二类:存伪错误
原假设 H0 为不正确(即其备择假设 H1 正确),但检验结果为接受 H0翻译】原来假设的结果本质上是错误的,但是实验中却有 错误的实验 结果恰好验证了原来假设
显著性检验
由于无法控制第一类和第二类错误率都很小(两类错误呈现负相关)所以一般给第一类错误的概率容错性更大一点。这时给出 a(0
拒绝域
如果落在某个区域,我们拒绝(认为原假设是错误的),即为拒绝域显著水平表示拒绝域的大小(即概率)不同正态分布的概率是要进行单独计算的,所以拒绝域以外是 不拒绝域
正态分布
t 分布
分布
分布
检验水平
又称“显著性水平”
在假设检验中允许犯第一类错误的概率,记为称 为检验水平其表示对 弃真的程度,一般 取 等
显著性检验
只控制第一类错误概率 的统计检验
一般步骤
根据问题提出原假设
给出显著性水平
确定检验统计量以及拒绝域形式
按犯第一类错误的概率等于 求出拒绝域
根据样本值计算检验统计量 的观测值 当 时,拒绝原假设 成立;否则,接受原假设