导图社区 概率论
概率论考研复习,主要知识点与分布
编辑于2020-07-18 20:54:36概率论
随机事件以及概率 4’
学科基础
事件关系与运算(基本概念)
事件的运算律:徳摩根律,较为重点
图,集合,发生
样本空间就等于E的所有结果的集合
注:E-随机试验
样本点-就是E的一个结果
事件A-使用“发生”这个词来描述:样本与事件的关系=类似与=>元素与集合的关系
事件的分类(仅作了解)
基本事件
不可能事件
必然事件
事件的运算律
交换律
结合律
同一运算
分配律
徳摩根律
计算方式: 上方的横线:连<->断 交并集的方向互相改变
混合运算
注:1.遇到具体随机试验E,学会引入事件,使用字母来表示2.体现事件的作用:用事件关系来体现试验E的过程和关系3.注意用词:至少,同时,都,etc.4.要化简运算,写事件运算关系:通过运算化简,含义化简,图化简
概率P(A)
古典概率——最为基础P(A)=A发生的次数/总事件发生的次数
注:1.判定古典概型:可否转化为抽球问题?2.计算A发生次数常用方法:排列组合
几何概率
注:1.判定几何概率:多与时间相关2.计算优先用几何公式,再考虑积分
伯努利概率,何为伯努利实验?
一次伯努利事件即为0-1分布,n次伯努利实验即为二项分布或几何分布其判定就看独立与重复
四种特性:非负,有限(可列)可加,规范(全集概率为1,空集概率为0),逆事件的概率(简单明了)
何为有限可加?
证明题貌似有限可加常考
条件概率P(B|A)
本质上是研究B的概率,研究B在A的前提下的概率
四个性质中的三个与普通概率性质相同
指非负性,逆概率,规范性
唯一不同的是:P(B1UB2|A) =P(B1|A)+P(B2|A)-P(B1B2|A)
Tips:要会判定条件关系P
事件的独立性
下述两种事件独立情况的定义与性质,要知道
两个事件独立
独立换言之就是两者的概率不会互相影响,两者没有概率关系,样本点可能有交叉
A与B相互独立,则A,B,非A,非B两两之间相互独立(四独立)
三个事件独立
三个事件独立=三个事件两两独立+P (ABC)=P(A)P(B)P(C).
概率五大公式
加法公式
减法公式
乘法公式
参照条件概率定义式
全概率公式
完备事件组:事件组两两互斥,全体和为1—->其作用为对样本空间内的任何事件做了完全划分
A=Aomiga = A(B1+B2+...+Bn) = AB1 + AB2 + ... + ABn —->互斥之和,可列可加
常见完备事件组
A与A的对立
具体E,E往往分为两次;前一次的结果作完备事件组
R.U
注:R.U->随机变量
一维离散R.U:X —>将X表示的事件作完备事件组
连续R.U
一维连续:对(-∞,+∞)划分区间作完备划分
二维连续:对整个平面作区域完备划分
各种情况概率之和
贝叶斯公式
所求条件的概率除以全概率
题型:找完备事件组->列概率式:无条件则为全概率,有条件即为贝叶斯
题型:1.随机事件的运算和概率->两道题,一类事件运算,一类概率P的问题,要写出事件的运算关系2.由条件概率关系转概率关系(遇条件去条件)/ 计算条件概率,使用定义式,概率公式,概率含义(古典概型)3.独立-> 两道题,一类由独立关系转概率关系(遇独立写P(AB)=P(A)P(B)),另一类为判断事件独立,使用定义,性质,含义来看
遇对立去对立(逆事件)
随机条件以及分布
何为随机变量及其分布
用数来表示结果,表示P与x的关系
随机变量R.U的本质是表示E的结果
R.U表示事件,特殊的有空集=x<-∞,全集= x<+∞
R.U具有双重性,具有实数的运算法则,又具有事件(概率)的运算法则
引入R.U:x来表示E的结果,将问题转化为R.U的问题
分布函数定义:F(x) = P{X<=x} (-∞,+∞). 1.F(x)->function 2.P{X<=x}定义取值方式3.F(x)可使用概率P来理解
F(x)规范书写,x的定义域属于RF(x)右连续,分断点处书写
非负性
规范性
单调不减性
右连续性
分布函数求事件的概率
注:用F求P(x属于z):1.将所求值化为“x<=”的形式2.“<=” 取F值。 “<”取F左极限
题型:
1.使用分布函数的性质判定是否是分布函数
2.求分布函数中的未知参数
3.通过上面求出的分布函数求一个概率
离散型随机变量
注意每种分布的记号
0-1分布
一次伯努利实验
注:要先确定事件A,然后确定P(A)。
二项分布X~B(n,p)
n次伯努利实验
注:n为实验次数,注意二项分布的形式
几何分布X~G(p)
表示事件A首次发生时所做的实验次数
注:定P,判断是否时几何分布,找关键词; 注意其形式:1.规范性,所有点之和为1 2.其方差E的定义形式(见数字特征一章)
泊松分布X~P(lambda)
了解泊松定理,泊松分布实际上时二项分布的实验次数趋近于∞的情况
描述某个事件段所经过的人数/车辆数(X)
注:Lambda使用规范性求得,其含义为方差与期望。规范性:求和=1
超几何分布X~P(M,N,n).
要求不高
描述:总共有N个产品,其中有M个正品,N-M个次品,取n个中有k个正品
题型:
点位只有一个概率分布
1.概率分布的判定
2.求概率分布中的参数:使用规范性求解,使用概率转化为X的分布求解
3.使用概率分布求概率
4.求X的概率分布
5. F(x)讨论其性质,4条共性,其函数呈阶梯型;F(x)与Pk的关联
连续型随机变量
均匀分布X~U(a,b)
注:1.观察f(x)的形式,写出f(x),判定是否为均匀分布。 2.均匀分布实际为几何概型,所以可使用概率方法解决
正态分布X~N(miu,delta^2)
大规模的数据问题
注:1.注意f的形式,会找到对应的量2.记住一些结论,从正态分布图上理解3.f的应用,使用其形式计算e^-k(x-miu)^2 ; 或者运用其结论
标准正态分布fi(x)
其为偶函数
性质
两个概率:P(x<=0)= 1/2;FI(x) + FI(-x) = 1
一般正态与标准正态的转化
x-miu/delta~N(0,1)
遇正态化标准正态
指数分布X~E(lambda)
表示要达到某一数量所需等待的时间(又称等待分布)
注:1.注意f的形式:会写f(x),判定E(lambda),计算含e^-kx的积分2.求lambda :联系期望与方差
概率密度的性质
非负性f(x)>=0
规范性:R上积分为1
判断是否为概率密度的充要条件
连续R.U
f的定义与性质
题目:
1.单独讨论f:判定是否为概率密度;求概率密度函数中的参数——用规范性。;求概率,常为积分,注意分区间积分
2.讨论F:判定是否为F;求参数,使用规范性,连续 ; 求概率P = F(右端点)- F(左端点)
3. f与F互求
随机变量函数的分布
求随机变量的概率分布(离散型)/分布函数,概率密度(连续型)
题型:
用f(x)求F(x):求变限积分
用F(x)求f(x):分两部分,当F(x)在分段区间内,f(x)=F`(x);当F(x)在分段点处,f(x)=0
已知R.U:X的分布,Y=g(x),求Y分布—-》考法:1.x的分布给法2.Y=g(x)的形式。先写出x的分布与g(x)
求Y分布的思路:1.先找Y的分布对应Y表示的事件A 2.再用Y=g(x)转化为用X表示事件A3.最后用X的分布求P(A),这样就可以得出Y的分布
根据X的类型可以将题目分为3类
离散型:Y的概率分布运算就是用Y=g(X)来替换Y,然后用X的概率分布求Y的概率分布
特殊:1.算Y值,Y=g(X),有限个
使用Y对应的函数g替换获得一个新表,整理得到Y的概率分布即可
连续型:注意,其Y=g(X)可以式离散的,可以是连续的,也可以是混合的,看问题中所求的分布形式
混合型
注:审清f(x)的形式,g(x)的形式;若g为一般类型,则使用分布函数法
分布函数法:先替换,然后转化为用X的f(x)求P{g(x)<=y};这时求X的范围善用作图来找
1.标出f(x)!= 0的区间I(f(x)的分段点)2.画出I上的Y=g(x)图,计算分段点,极值,渐近线3.标出g(x)<=y的区域D4.平移水平线L:y,从-∞向上平移,写出该水平线与区域D相交的范围
F(y)分段原则
水平线与D相交边界线变化——积分线变化
水平线与D相交所对f(x)变化——被积函数变化
常见分布7种
题目:
1.考分布自身:形式,结论
2.分布的运用,考理论:概率分布,概率密度,分布函数
多维随机条件以及其分布
二维随机变量的定义以及何为其分布函数?
共性的问题:结果的体现——二维随机变量/随机向量
(x,y)两个变量关系是交的关系;其地位是平行的
二维随机变量的分布函数:用于体现交事件的关系
可推广为n维随机变量的分布函数
F(x,y) = P{X<=x,Y<=y}
P{X<=x,Y<=y}固定了取值方式,其以(x,y)为顶点的取值为iii象限方向的区域的概率
四个性质
非负性
除了与一维类似的非负性表现,还有一个体现
指:对任意a<b,c<d有P{a<X<=b,c<Y<=d} => F(b,d)+F(a,c) - F(a,d) - F(b,c) >= 0
规范性:用F与P的转换理解
单调不减性:分别对于某单独的一个变量单调不减
右连续性:与单调不减类似,都是对于单独某个变量右连续,另一个变量视作常数。
注:1.F(x,y)为分布函数与上面四条成充要条件
边缘分布函数
将其中一个变量设为必然事件,即—>+∞,然后只关心另一个变量分布函数
注:1.边缘指的就是单个变量的R.U分布2.其分布关系可以切换为P来理解3.用分布函数求边缘分布函数,注意极限的求法——由极限定函数,区别变量
3.eg.求x的边缘分布函数,先定x,然后确定F,最后在x竖线上对y求极限
注:
1.(X,Y)表示的是积事件,相当于X交Y
2.可推广为n维随机变量:(X1,X2,...,Xn)相当于n个事件的积
二维离散型随机变量
(x,y)可列可数
概率分布
联合概率分布是用表格表示,表格又称概率分布矩阵
实际上是表示点对的交事件的概率
注:1.(x,y)的值的确定,转化为由x,y的值确定2.如果概率分布满足Pij,则Pij满足非负与规范性,Pij要对应x,y表示的事件3.要会看懂其分布表
边缘概率分布
对X求行和,对Y求列和,其本质是从分布矩阵来的
条件概率分布
由条件概率而来
由此可以得出其乘法公式,注意乘法公式中的条件
注:1.在条件概率分布中,“|”后者作常数,其形式就是直接从事件的条件概率转换而来2.其存在的前提Pij > 0 3.条件概率大本质是反应“|”前者的概率分布4.联合概率分布可以求边缘分布,可以求条件概率分布;反之不可;边缘概率分布于条件概率分布无直接关系,但条件+边缘可以求联合
eg:P.j与Pij/P.j求Pij的书写要写两个部分
当P.j>0,Pij = Pij/P.j *P.j
若P.j = 0,Pij = 0
题目:
1.二维离散型变量的概率分布问题
考判定(现在很少考):验证性质
规范性
用概率分布求概率=在D内点对的P之和
求概率分布:求(x,y)分布,先定X,Y取值,然后再算Pij(对照分布表)
2.边缘分布问题
求Pi.,P.j
由边缘分布转化为概率问题
3.条件概率分布问题
求条件概率分布
由条件概率分布转化为概率问题
4.以上三者关系互求
二维连续型随机变量
联合概率密度
定义
性质
非负
规范
注:f(x,y)非负;可积:二重积分存在且反常积分收敛书写形式区分D与D的边界,D的边界处值为0
分布函数和概率密度的关系
1.F(x,y)与其积分形式的互写与互求
2.点对落在一定区域D上的概率,直接对联合概率函数求二重积分
3.若在某一点处连续,则存在其二元偏导
由f求F,不常考,求二重积分
由F求f,其书写分两部分:F在分段区间内,直接求二阶偏导,在分段曲线上直接写0。
边缘概率密度
本质是求x,y的概率密度
注意其公式形式
由概率密度函数求边缘概率密度,与离散型类似,先定x,再定f,最后在x的竖线上对y积分
条件概率密度
概率密度乘法公式
题型:边缘+条件求联合——书写注意分作两个部分,一个是边缘>0 ,另一个是边缘 = 0 ;大于0则使用乘法公式写出
其存在性具有前提:在“|”后者边缘密度不为0的情况下才有条件概率密度
其实质是关于“|”之前的项的概率密度
“|”后者在这里是作为常数看待的
f(x,y)求条件概率密度,可求。
常见二维连续型随机变量
二维均匀分布
形式:面积分之一;要会判定均匀分布
(x,y)服从均匀分布,且其是几何概型->在区域D上对函数作二重积分,如果是一些特殊区域,可以直接转化为求面积
服从均匀分布:1/(b-a)(d-c) ——> x,y独立(x属于a到b;y属于c到d)
二维正态分布
(X,Y)~N(miu1,miu2,delta1^2,delta2^2,rou) rou是x,y的相关系数,其余都是期望和方差
二维正态的性质
前3条会用即可
题型:
均匀分布
f的形式
结论->求P
正态分布
参数的含义
结论的应用
题型:
判定是否是概率密度
求参数——规范性
求概率——区域上作二重积分
边缘/条件,类似于离散型的考法,在此不赘述
三者互求
两个条件概率P注意区分
条件是一个区间:使用条件概率的定义式
条件是一个点:只能用条件概率密度
随机变量独立
一定要于事件独立相对应
X,Y分别表示的事件之间是独立的
子主题
注:R.U独立,其含义表现在其取值;可以推广为n个随机变量独立==>所有边缘相乘;考点:1.独立转P关系,分布关系2.判定独立——第一是使用充要条件,特殊的使用结论(比如二维正态rou=0)3.判断不独立——第一考虑充要条件,然后是找数字特征(相关系数,协方差),特殊的情况用结论;最常考取X,Y的区间表示事件不独立(存在I,J两个区间有x属于I,y属于J的概率之积不等于其积事件之概率)
随机变量函数的分布
问题描述:已知(X,Y)分布,Z=g(x,y)->求Z分布
思路:Z表示一个事件A->用(X,Y)表示A->最后用g描述Z
题型:
1.一般情况:参照一维随机变量
2.特殊情况:(x,y)的点对是有限个的,此时改写(x,y)的分布表,然后整理得到Z的分布(整理Z值,整理P(Z))
注:Fz分段原则:1. g与D0边界线相交发生变化->Fz分段2.D与D0相交区域内所对的f有变化
参照一维,相类似
随机变量的数字特征
数学期望(E)
E的含义:R.U取值的平均值
加权平均,权重= 其所占的概率P
一维离散型/二维离散型
定义就是值*权重(概率)之和
一维连续型/二维连续型
注:1.E的含义就是加权平均,其本质是定义了一种运算:E()=对()内的内容求平均值,其结果是一个数。2.定义的形式:提供了用定义写/算期望的方法——离散R.U用概率分布算,连续R.U用概率密度算,不能用分布函数计算3.提法:求谁的平均->求谁的期望
性质:从含义的角度理解
1.加减无条件线性分配
2.积事件拆分需满足独立关系
注意使用这两条性质的前提条件
3.E(a)=a
其实现了E的变形
方差(D)
性质
1.常数的D为0
2.D(aX) = a^2 D(X)
3. D(X+-Y) = D(X)+D(Y)+-2Cov(X,Y)
4. X,Y相互独立,则D(X+-Y) = D(X) + D(Y)
注:1.使用D的性质变形2.使用D的性质的时候注意正负条件
研究R.U的取值波动问题:反映X值的稳定性问题
实际上也是求的该波动函数的期望
两个公式
常见随机变量的数学期望和方差
要背
0-1分布
二项分布
泊松分布
几何分布
均匀分布
指数分布
正态分布
卡方分布
注:1.要记住E和D的值2.两个应用:使用Ex,Ex^2的定义形式来做计算;算Ex^2 = Dx +(Ex)^2
协方差(Cov)
其本质也是期望,是[X-E(x)][Y-E(y)]的期望
公式:Cov(X,Y) = E(XY) - E(X)E(Y)
可以先算EX,EY;再算EXY。可以一定程度上减少计算量(指EX或EY等于0)
可以使用Cov来计算EXY
性质:
1.Cov(aX,bY) = abCov(X,Y)
2.Cov(c,X) = 0
其中的a,b,c是常数
3.Cov(X1+X2,Y) = Cov(X1,Y) + Cov(X2,Y)可以无条件分配
4.Cov(X,X) = D(X)
相关系数
定义形式:协方差/X,Y标准差之积
变形为求Cov
性质:
1.相关性小于等于1
2.充要条件
3.四等价
不相关与独立的关系
X与Y不相关仅表示其不存在线性关系,可能存在非线性关系;但独立是指X与Y之间的值互补影响,即不存在任何关系
相互独立=>不相关;相关=>不独立
特殊结论:其前提为X,Y~N,则XY相互独立<=>X与Y不相关
注:1.使用rou求Cov,D2.注意其含义与定义式,用以求P
注:1.rouXY是用于反映X与Y的线性相关程度的
题型
1.常见分布的数字特征应用
常见分布的E和D的问题,注意E,D的结果,以及EX,EX^2的转换问题
考题:1.用E和D转条件:E和D的关系,或者用定义转化为分布2.使用常见分布计算E,D,Ex^2
一般分布:审清R.U的形式,然后再定方法——优先用已知结论,匹配形式,凑形式,套结果;后用定义->先化简,明确所求值,再算E
2.随机变量函数的数字特征
一般函数
一般还是使用g(x),g(x,y)求E,D
计算:
g(x),g(x,y)形式:凑结论
E,D,Cov性质化简
转化g(x),g(x,y)形式
分解R.U->独立之和
换元,二维换一维
特殊函数
|ax+-by|
使用X,Y分布求E|ax+by|
换元:U = ax+-by,求U分布,然后计算E|U|
max/min
分解:max(x,y),min(x,y)
{max(x,y)<=Z} = {x<=Z,y<=Z} {min(x,y)>Z} = {x>Z,y>Z}
考题
分布
X,Y不独立
X,Y独立
同分布
不同分布
计算E,D :分解max->转化为min;使用(x,y)计算;使用max,min计算
3.数字特征的综合应用
已知数字特征:转条件
P关系:定义,性质
X,Y关系(独立,不独立)
大数定律及中心极限定律
很少考
切比雪夫不等式
其常用于估算
大数定律
切比雪夫大数定理
条件:相互独立;同分布;期望存在,方差存在
伯努利大数定理
辛钦大数定理
与切比雪夫相对比,不要求DX存在,又称弱大数定理
作用:大数定理讨论随机变量之和与其期望的关系
中心极限定理
棣莫弗-拉普拉斯中心极限定理
列维-林德伯格中心极限定理(实际上是上一中心极限定理的一般形式)
要求:独立同分布,具有期望与方差
作用:讨论随机变量之和的近似分布问题
近似为正态分布
题型
1.切比雪夫不等式
要求期望方差均存在
解题思路:1.找到需要的R.U 2.求出E,D3.写出不等式形式4.对比,求P,数字特征
2.大数定理
判定是否满足大数定理:直接验证条件即可
根据收敛关系求收敛值,以及当中的一些参数
解题思路:1.先找随机变量2.找E(R.U)3.对比定理/写出定理(依概率收敛为其期望)
主要还是考E的求解
3.中心极限定理
判定是否满足,验证条件
求P,求参数
解题思路:1.找随机变量2.算E,D3.写出X~N4.对比定理
数理统计概论
对应概率论中的相应点:将低维推广到高维
常用统计量
就是R.U函数
总体和样本
样本均值:是一个算数平均值,其期望就等一总体期望,其方差就等于总体方差
考法:配形式,用结论
样本方差:注意其除数为n-1
注意S^2的形式
ES^2 = delta^2
注:1.X1,...,Xn ->n个随机变量2.凡见简单随机样本=>这n个随机变量相互独立;其分布为同分布
三大分布
讨论三个特殊随机变量函数的分布问题
卡方分布
t分布
F分布
正态总体的抽样分布
讨论统计量的分布
前提是所有项都来自正态总体
题型:
1.讨论统计量的分布:3大分布的——判定,性质,结论
X拔,S^2:其形式和结论
考:求E,D
三大分布考:判定,看形式,如果看不出来则可以稍微整理一下——找随机变量,判定随机变量之间是否独立,凑各自分布,写分布形式,对比;求值的问题,求E,D(重心在卡方),求参数就配形式找关联,定R.U的值(重心在t分布);分布关系,使用F,1/F或者t,F的关系求P,R.U,使用替换R.U 来解决
2.考常见统计量的数字特征:E,D,卡方
参数估计
点估计(数一11`)
所谓点估计就是求seta的值
找一些随机样本Xi。。。Xn(与X同分布),然后找标准来建立这些随机样本与seta之间的关系,最后求出seta的估计值seta`
看样本给的是值还是代数,是值就是求估计值,代数就是求估计量,此标准不同给出不同方法
矩估计
其建立标准为E(X)= X均值
解题步骤:1.求E(X) 2.令E(X)= X均值3.求seta = seta(。。。)
最大似然估计
其建立标准为保证简单随机样本在其观测值(X1,。。。,Xn)处的概率最大化==>转化为P最大化的问题==>讨论其联合分布的最大值点,即为seta的估计
该联合分布函数称为最大似然函数
做法:1.找其联合分布L2.求L的最大值点
题型:
1.矩估计和最大似然估计
2.估计量的评选标准
3.假设检验
随机试验
事件的关系
事件包含
事件相等
事件互斥
注:对立一定互斥,互斥不一定对立
对立(互逆)事件->补集
P的运算变形
使用可列可加性,前提是要将事件变为互斥相加的形式:可以用图的方法来分解
概率为0或1的事件与任何事件都是相互独立的
B包含于A,则P(A-B)=P(A)-P(B)且 P(B)<=P(A). Tips:注意
性质:1.非负。2.所有点值之和为1 <=> Pk为x的概率分布的充分必要条件
R.U类型的区分
离散型
其取值可列可数
其分布为概率分布
其函数形式为阶梯形
连续型
其取值为一个区间
其分布为概率密度
其函数形式为连续的
混合型
区分特征为以上两种的混合
A,P(A)