导图社区 概率论与数理统计
根据2020新版数学一考纲制作,注释包含大量定义公式等。分支内容包括:随机事件与概率、一卫随机变量及其分布、多维随机变量及其分布等。
编辑于2021-01-11 13:08:00概率论与数理统计 数学一
随机事件与概率
随机事件及其运算
概念:随机试验;样本空间,样本点;随机事件
关系:包含,相等,对立,互斥
互斥/互不相容:AB=Æ
运算:和,积,差,逆
运算法则

概率的类型
古典概型
Ω仅含有限等可能样本点 排列组合公式:摸球问题,随机入盒问题,随机取数问题 
几何概型
Ω为可度量几何区域,实验结果可能性相同
统计概型
n次独立重复试验,A发生的频率具有稳定性,在p附近波动,n越大波动越小
公理定义
满足: 非负性,事件概率 P(A)≥0 规范性,样本空间概率 P(Ω)=1 可列可加性
概率计算
加法,求逆,求差,乘法
P(A-B)=P(A)-P(AB) P(AB)=P(A)·P(B|A)=P(B)·P(A|B)
条件概率
公式法 缩减样本空间:求出条件密度定积分
全概率公式,贝叶斯公式

n重伯努利试验
n次试验中事件A发生k次 第k次试验事件A首次发生
独立
定义:P(AB)=P(A)P(B)
A、B事件在概率上互不影响 特别的,概率为0或1的事件与任何事件都相互独立
充要条件
 下式同时成立时A、B、C相互独立: P(AB)=P(A)P(B) P(AC)=P(A)P(C) P(BC)=P(B)P(C) P(ABC)=P(A)P(B)P(C) A、B、C相互独立→A、B、C两两独立,且P(ABC)=P(A)P(B)P(C),反之不然 P(A-B)=1→A、B、C相互独立
性质
独立事件,不重叠分组运算后仍独立
互斥,独立,对立
题型
摸球问题
入盒问题
概率公式计算
概率关系推不出事件的关系
事件独立性
一维随机变量及其分布
随机变量
定义,分布函数F(x),概率密度f(x)
分布函数性质(必要条件): F(x)单调不减,对任意x1<x2,F(x1)≤F(x2); 0≤F(x)≤1,且F(-∞)=0,F(+∞)=1; F(x)右连续,即F(x+0)=F(x); 对任意的x,P{X=x}=F(x)-F(x-0);F(x)在x处连续时⇔P{X=x}=0; 对任意x1<x2,P{x1<X≤x2)=F(x2)-F(x1)。 连续随机变量概率密度 f(x) 的值可能大于1,概率密度函数是对连续随机变量定义的,本身不是概率,只有对连续随机变量的概率密度函数在某区间内进行积分后才是概率 若f(x) 关于直线x=a对称,当EX存在时,有EX=a.
离散型随机变量
二项分布:X~B(n,p)
Binomial Distribution 独立重复试验,只有两个结果(发生,不发生)
几何分布:X~G(p)
Geometric Distribution 次数未知的独立重复伯努利试验,A首次发生时的试验次数 【说明】在伯努利试验中,如果前m次试验中,事件A一直没出现,则等到A出现时,所需要的等待时间仍服从同一个几何分布,其分布与m无关,即P{X=m+k | X>m}与m无关,这就是所谓的几何分布的无记忆性.
超几何分布:X~H(n,M,N)
Hypergeometric Distribution 超几何分布为不放回抽样 若为放回抽样,当N→∞,可用二项分布代替超几何分布
泊松分布:X~P(λ)
意义:t时间内,期望为λ的事件发生k次的概率,因此k=λ时的概率最大 当k很大,p很小时,二项分布可用泊松分布逼近 
连续型随机变量
均匀分布X~U(a,b)
Uniform Distribution
指数分布X~e(λ)
Exponential Distribution 无记忆性:P{X>m+n | X>m}=P{X>n},P{X≤m+n | X>m}=P{X≤n} 
正态分布X~N(μ,σ²)
正态分布标准化;对称性 Φ(-x)=1-Φ(x),当a>0时,P{ |x|≤a}=2Φ(a)-1 独立正态分布:aX±bY+C~(aμ₁±bμ₂+C,a²σ₁²+b²σ₂²) 1σ:0.6826;2σ:0.9544;3σ:0.9974 
随机变量函数的分布
离散型
连续型
定义法
将x的分界点代入y的表达式,得到y的分界点
公式法
条件:Y=g(x)单调 求y的反函数x=h(y) Y=F(X)(F(X)是X的分布函数)的分布函数与X的概率密度函数无关,Y=F(X)在[0,1]上服从均匀分布,对任意连续型随机变量X均成立
非离散非连续型
题型
分布函数、概率密度的性质
常用分布概率的计算
求随机变量函数的分布
多维随机变量及其分布
二维随机变量分布
掌握分布和密度的性质 联合分布 联合密度 边缘分布 边缘密度,边缘分布不能唯一确定联合分布,除非X、Y独立 条件分布 条件密度
二维离散型随机变量
可能以概率关系形式,如给出P(A)、P(AB),隐含不独立
注意是否独立!
二维连续型随机变量
均匀分布
二维正态分布
独立等价于不相关 联合分布可以确定边缘分布,反之不一定成立 若(X, Y)服从二维正态分布,则(X, Y)·A也服从二维正态分布,A为二阶可逆矩阵,(多元正态分布变量的线性组合仍然是多元正态分布) 
独立性
离散型
X、Y独立,则行/列成比例
连续型
二维正态:ρ=0⇔相互独立⇔不相关 X、Y独立→则g(X)、h(Y)独立,反之不成立 
求随机变量函数的分布
通常结合条件分布、全概率、独立性、数字特征考大题,必考 离散型考由边缘分布求整体分布 结合级数求期望
离散型
由边缘分布,求整体分布
连续型
最值函数的概率密度与期望的求法 
定义法
二重积分求Z的分布函数 视具体情况可能需分区域积分
公式法
xOz或yOz坐标系中 卷积公式:全平面积分得概率分布,变上限积分求导得概率密度 可不掌握,重点是定义法 
离散+连续型
定义法,全概率公式 注意检验分布函数分段处的连续性
题型
求联合密度、边缘密度、条件密度

已知边缘密度求联合密度/联合分布
求随机变量的函数的分布
注意检验分布函数分段处的连续性
随机变量的数字特征
期望与方差
期望
积分求和,级数求和
定义
一维随机变量的数学期望,随机变量的函数的数学期望 二维随机变量的函数的数学期望 定义求期望
性质
E(ΣkX)=Σ(kEX) X、Y、Z相互独立➜EXYZ=EX·EY·EZ E(X+Y)=EX+EY无关独立性
方差
定义
DX=E[(X-EX)²]
性质
DX≥0,且DX=0⇔P{X=EX}=1 D(ΣkX)=Σ(k²·DX) D(XY)=DX·DY+EX·EX·DY+EY·EY·DX D(X±Y)=DX+DY±2Cov(X,Y),若X、Y独立,则D(X士Y)=DX+DY X关于期望EX的偏离程度不超过它关于任意常数C的偏离程度
常用期望与方差

协方差和相关系数
矩
原点矩,中心矩,混合矩,混合中心矩
协方差
Covariance Cov(X,Y)=E[(X-EX)(Y-EY)]=E(XY)-EX·EY 独立变量协方差为零 Cov(X,Y)=Cov(Y,X); Cov(X,X)=DX; Cov(aX+c,bY+d)=abCov(X,Y); Cov(X₁+X₂,Y)=Cov(X₁,Y)+Cov(X₂,Y) D(X±Y)=DX+DY±2Cov(X,Y)
相关系数
|ρ|≤1 |ρ|=1⇔Y=aX+b,a=±√(DY/DX),b=EY-aEX 若X与Y的相关系数为ρxy,设U=a₁X+b₁,V=a₂Y+b₂,则U与V的相关系数为ρuv=ρxy·a₁a₂/|a₁a₂|
相互独立与不相关的区别与联系
对于二值变量或伯努利变量(0-1变量),不相关等价于独立 
概要
概要
数字特征计算
分布已知
利用公式和常见期望方差 结合抽样分布,转化成正态分布、χ²分布等 将复合变量拆解为独立部分,例如:Yi=Xi-x̅
分布未知
绝对值函数、最值函数(例如T=Min{X₁,X₂......})、复合函数等 先求随机变量的函数的分布 例如:最值函数求期望,先求最值函数的概率密度,由定义计算期望 二维随机变量函数期望公式(定义) 离散函数与级数求和结合
相关、独立判断计算
大数定律与中心极限定理
切比雪夫不等式

依概率收敛

大数定律
任意给定正数ε
切比雪夫大数定律
条件:Xi相互独立同分布,EXi、DXi存在 意义:揭示了样本均值和真实期望的关系,相互独立的随机变量的算术平均值集中在它的期望附近,说明平均值具有稳定性 
伯努利大数定律
意义:揭示了概率与频率的关系,说明频率依概率收敛于概率 
辛钦大数定律
条件:Xi独立同分布,EXi=μ 意义:揭示了算术平均值和数学期望的关系,说明可用算术平均值近似实际值,用算术平均值来估计数学期望 
中心极限定理
意义:一定条件下,原本不属于正态分布的一些随机变量的总和分布渐近地服从正态分布 条件:独立,EX、DX存在 
列维-林德伯格定理
条件:独立同分布,EX、DX存在 意义:说明定理条件下,n很大时,独立同分布的随机变量序列的前n项和近似服从正态分布N(nμ,nσ²) 
棣莫弗-拉普拉斯定理
条件:泊松分布/二项分布 此定理说明二项分布以正态分布为极限 
概要
根据大数定律、中心极限定理求参数
数理统计的基本概念
基本概念与统计量
总体,简单随机样本
统计量
样本均值X̅
样本方差:S²,样本标准差:S
k阶样本原点矩:Ak
origin moment Ak=(ΣX^k)/n
k阶样本中心距:Bk
样本均值的分布
单个正态总体
x̅~N()
两个正态总体
非正态总体
x̅~N()
任意总体
E(X̅)=EX=μ D(X̅)=(DX)/n E(S²)=DX x̅与S²相互独立
概要
S²与x̅相互独立
求样本均值的分布
求统计量的数字特征
抽样分布
正态分布标准化
χ²分布
χ²检验就是统计样本的实际观测值与理论推算值之间的偏离程度。 实际观测值与理论推算值之间的偏离程度就决定其χ²值的大小。理论值与实际值之间偏差越大, χ²值就越大,越不符合;偏差越小,χ²值就越小,越趋于符合;若两值完全相等时, χ²值就为0,表明理论值完全符合。
概念
独立标准正态分布的简单随机样本的平方和
性质
X服从参数为1/2的指数分布,则X服从参数为2的卡方分布 E(χ²)=n,D(χ²)=2n 可加性,条件:相互独立
t分布
概念
X、Y独立,X~N(0,1),Y服从χ²分布 T=X/√(Y/n)~t(n)
性质
概率密度为偶函数 n充分大时近似于标准正态分布
F分布
概念
X、Y独立,服从卡方分布 F=(X/n)/(Y/m)~F(n,m)
性质
F~F(n,m),1/F~F(m,n) 分位数关系
正态总体下的抽样分布

分位数
性质
上下侧换算,上侧α分位数=下侧(1-α)分位数 正态分布、T分布的对称性得,N1-α=-Nα,T1-α=-Tα F1-a=1/Fa
可加性
条件:相互独立 
概要
利用抽样分布求期望方差
将不独立的复合变量拆解为独立部分,例如:Yi=Xi - X̅
抽样分布性质
分位数相关计算
参数估计
点估计
矩估计法
依据:样本矩依概率收敛于相应的总体矩 求原点矩,用原点矩表示θ,一阶原点矩为0则求二阶矩,考研大纲不超过二阶矩
最大似然估计法
定义:求使L(θ)取得最大值的θ 似然函数为各样本概率之积,离散变量要注意 似然函数->取对数->求导数->令导数为0 非一般情况有: 多个参数则求偏导 变量为函数,则根据总体分布求其概率密度再得出L(θ) 导数参数无确定值或无法求导,则使用定义判断使L(θ)取得最大值的θ 类似于EY、P{x≥a}的最大似然估计量
估计量的评判标准
无偏性和有效性是在样本容量n固定的前提下,对θ的优劣评判,当样本容量无限增大时,估计量越来越接近要估计的未知参数的真值,这就是估计量的一致性
无偏性
无偏:E(θ^)=θ
有效性
有效:无偏估计量θ1、θ2,其中D(θ^)较小者更有效,D(θ^)最小的θ^是θ的最小方差估计
一致性/相合性
n→∞,θ^依概率收敛与θ,则θ^是θ的一致估计量
区间估计
1-α称为置信度或置信水平
求未知参数θ的双侧置信区间
单个正态总体
μ的置信区间关于样本均值x̅对称,x̅=(置信上限+置信下限)/2
求均值μ
σ²已知

σ²未知
E(S²)=σ²,无偏估计 
求方差σ²
μ已知

μ未知

两个正态总体
均值差
方差比
题型
求矩估计、最大似然估计
判断无偏性有效性
假设检验
单正态总体的假设检验

两类错误
H为真,而作出了拒绝H的判断,称为犯第一类错误,犯错误的概率记作α H不真,而作出了接受H的判断,称为犯第二类错误,犯错误的概率记作β
两个正态总体的假设检验