导图社区 概率论-北京大学出版社
列出了概率论与数理统计基础知识架构体系
编辑于2020-10-21 18:43:51概率论与数理统计
1.随机事件及其概率
事件
类型
必然事件
偶然事件
事件间关系
包含关系
(A⊂B)
相等关系
A=B
和事件
并集(A、B至少有一个发生,A∪B)
积事件
交集(A、B同时发生,A∩B)
差事件
A-B,A发生B不发生
A-B=A-A∩B=A∪B的补集
互不相容事件(互斥)
A、B不同时发生,无交集
A∩B=0
对立事件
A,B互不相容,且A、B构成全集
A∩B=0,A∪B=Ω
事件运算
结合律
交换律
分配律
(A∪B)∩C=(A∩C)∪(B∩C)
(A∩B)∪C=(A∪C)∩(B∪C)
徳摩根律
事件的概率
概率的初等描述
概率的定义
事件发生的可能性的概率,P(A)
概率的性质
P(Ω)=1,P(0)=0
0≤P(A)≤1
概率模型
古典概率模型
条件
有限个样本点
等可能性
符号
P(A)=A的有利样本点/Ω的所以样本点
排列组合
加法原理
几类方案
乘法原理
分几步
排列
不重复排列
不放回
从n个不同元素中取出m个排列
重复排列
从n个不同元素中取m个排列
可放回
组合
性质
非负性
0≤P(A)≤1
规范性
P(Ω)=1,P(0)=0
有限可加性
条件
A,B互不相容,且A、B构成全集
几何概率模型
概率分布
线段
平面
立体
性质
非负性
0≤P(A)≤1
规范性
P(Ω)=1,P(0)=0
完全可加性
条件
A,B互不相容,且A、B构成全集
频率与概率
公理化
公理
公理1
非负性
0≤P(A)≤1
公理2
规范性
P(Ω)=1,P(0)=0
公理3
完全可加性
条件
A,B互不相容,且A、B构成全集
性质
性质1
A为不可能事件,P(A)=0,逆命题不成立
性质2
有限可加性
条件
A,B互不相容,且A、B构成全集
性质3
性质4
1.P(A-B)=P(A)-P(AB)
2.若B⊂A,则P(A-B)=P(A)-P(B)
性质5
1.A,B为两个任意事件,P(A+B)=P(A)+P(B)-P(AB)
加法的一般公式
P(A+B+C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC)
2.若A,B互斥,则P(AB)=0,则P(A+B)=P(A)+P(B)
条件概率与全概率公式
定义
性质
P(A|B)≥0
P(Ω|B)=1
A1,A2…An不相容
乘法公式
P(AB)=P(A|B)P(B)=P(A)P(B|A)
P(ABC)=P(A)P(B|A)P(C|AB)
全概率公式
A1,A2…An是E的完备事件组
贝叶斯公式
已经知道结果找原因
改种概率在总情况下的概率
事件的独立
定义
A的概率不受B发生与否的影响
P(A|B)=P(A)
定理
A, B独立,P(AB)=P(A)P(B)
什么时候用独立?
常识性,投篮、射击等
题目明确说明独立
伯努利模型
两种实验
n个独立重复实验序列
n次重复实验
伯努利实验
条件
结果只有两种
n次独立重复实验
定理
A的概率为p,n重伯努利实验中发生k次的概率
2.随机变量及其分布
随机变量的概念
样本空间
唯一对应
随机变量的类型
离散型
有限个
无限可列个
非离散型
其他
连续型
随机变量及其概率分布
离散型随机变量及其概率分布
定义
性质
非负性
归一性
分布列
常见离散型分布
0-1分布
只做一次,只有两种实验结果
几何分布
A为某一事件,P(A)=p,第k次首次发生,前k-1次未发生
二项式分布 X~B(n,p)
放回
P(A)=p,n次试验发生k次
泊松分布
适用范围
电话台收到呼叫次数
等车、收银台等公共设施
用泊松分布近似计算二项式
超几何分布
不放回抽样试验,总样本N大,抽样n小,较准确
N>=10n,不放回抽样近似看成放回抽样(n次伯努利试验)
连续型随机变量及其概率密度函数
定义
方法:分段求积分+积分可加性
性质
非负性
归一性
求参数
点的概率为0
特殊点讨论
连续型随机变量取个别值的概率为零(积分上下限数值一样)
概率为0的事件未必是不可能事件
概率为1的事件未必是必然事件
分布函数
随机变量取值不超过x的概率
性质
非负性
F(x)不减
至多可列个间断点,F(x) 右连续
离 右连续
连 连续
常见公式
一般分段算,一般第一段为0,最后一端为1
常见连续型分布
均匀分布X~U[a,b]
指数分布
相关公式
第四条称为无记忆性
正态分布
非标准化要先标准化
随机变量函数的分布
X的分布已知,Y与X存在一定关系,求出Y的分布
离散型
写出X的分布列,将Y值替换相应的X,相同的合并在一起,由此构成Y的分布列
连续型
分布函数法
注意先搞清楚对应的区间
公式法
仅适用于单调函数
注意先搞清楚对应的区间
X服从[a,b]均匀分布,Y=kx+C(K!=0)服从相应区间上的均匀分布
二维随机变量及其分布函数
定义
性质
非负性
不减性
右连续
边缘分布函数
二维离散型的联合分布及边缘分布
联合分布与边缘分布的关系
联合分布可唯一确定边缘分布
边缘分布不能确定联合分布
X、Y独立时,边缘分布可唯一确定联合分布
二维连续型的联合分布及边缘分布
联合
二维随机变量的联合分布函数
二维随机变量的联合概率密度函数
二维空间一条线的概率为0
边缘
二维随机变量的边缘分布函数
二维随机变量的边缘概率密度函数
二维分布
均匀分布(按面积)
正态分布
二维条件概率
性质
非负性
归一性
离散型
条件概率
连续型
条件频率密度函数
条件概率分布函数
随机变量的独立性
离散型
连续型
二维随机变量函数的分布
离散型
X,Y不独立时,Z是关于X,Y的函数,(X,Y)-->p,由此构成新的分布列
X,Y独立时,Z是关于X,Y的函数,(X,Y)-->p1*p2
0-1分布
两个泊松分布
连续型
分布函数法
Z=X+Y
X、Y不独立时
X、Y独立时
卷积公式
正态分布的可加性
M=max(X,Y),N=min(X,Y)
3.随机变量的数字特征
数学期望(做题时优先考虑用性质)
定义
离散型随机变量
数学期望不是一定存在
连续型随机变量
数学期望不是一定存在
随机变量函数的数学期望
离散型
连续型
二维随机变量的数学期望
离散型
连续型
性质
条件期望
离散型
连续型
方差
定义
(反映与期望的偏离程度)
(常用)
标准差
离散型随机变量
连续型随机变量
性质
标准化
常见的期望与方程
协方差(会受计量单位影响)
定义
性质
相关系数(为了解决协方差受计量单位影响这个问题)
衡量X,Y间的线性关系
X,Y不相关这里指的是线性不相关,X,Y独立是指两者没有任何关系包括非线性关系
X,Y独立则X,Y不相关
X,Y不相关则X,Y不要一定独立
二维正态(X,Y),独立与不相关等价
原点矩和中心矩
X的k阶原点矩
X的k阶中心矩
X与Y的(k,l)阶联合原点矩
X与Y的(k,l)阶联合中心矩
4.大数定律与中心极限定律
大数定律
大量重复试验的平均结果的稳定性
切比雪夫不等式
相关概念
依概率收敛
大数定律
独立同分布
推得(多次试验)
切比雪夫大数定律和伯努利大数定律阐述重复同样多次试验,以事件发生的频率值作为事件在一次随机试验中发生的概率的合理性及稳定性
伯努利大数定律
证明了频率可以表示概率
二项式分布的方差与均值+切比雪夫不等式+夹逼定律证明
切比雪夫大数定律
证明了样本均值可以代替总体均值
切比雪夫不等式+夹逼定律证明
辛钦大数定律
证明平均数可以表示期望
中心极限定律
中心极限定理研究的就是在什么条件下,当n趋向无穷时极限分布是标准正态分布
独立分布条件下的中心极限定理
德莫佛-拉普拉斯中心极限定理
5.统计量及其分布
总体与随机样本
总体:全体
有限
无限
X 总体分布
样本
抽样:总体中抽一部分
简单随机抽样
特点
同分布
独立
公式
离散型:联合概率
连续型
分布函数
频率密度
统计量
定义:不含任何未知参量的样本的函数
统计量的观测值
常用的统计量
样本均值
修正后的样本方差
修正后的样本标准差
样本k阶原点矩
样本k阶中心矩
观察值是将公式中大写字母换成小写,是实际测得的数据计算出的结果
结论
抽样分布
卡方分布
定义
性质
卡方分布具有可加性
上α分位数
当n≥45时
t分布
定义
又称学生氏分布
图像具有对称性
上α分位点
当n>45时
用正态分布近似:
F分布
定义
上α分位点
正态总体分布下的抽样分布
一个正态总体
两个正态总体分布
6.参数估计
点估计
相关概念
参数概念:分布中的重要参数
任务:取样本构造函数来估计参数
参数空间:参数的取值范围
估计
点估计就是猜一个数
矩估计就是猜一个范围
矩估计法
依据:辛钦大数定律+随机变量函数地分布
可用样本的矩去估计总体的矩
低阶估计优于高阶估计
极大似然估计法
基本思想
p大的事件比p小的事件更容易发生
将使A发生的最大的参数值作为估计值
做题模板
其实一般算出来的结果和矩估计法的结果相通
估计量的评价标准
无偏估计:由样本空间数据所求的样本估计量的数学期望要等于对应的估计量的真值(无系统误差)
渐近无偏估计
有效性:估计量的方差越小越有效
一致性
区间估计
思路
区间长度
多大概率落入
定义
正态总体参数的区间估计
主题
逆向思维
完备事件组
A1,A2,…An两两互不相等,且它们只和为Ω
无限可列:可以排序