导图社区 概率论与数理统计
重磅!关于概念论与数理统计思维导图来啦!随机事件与概率、离散型随机变量及其分布、连续型随机变量及其分布、随机变量的数字特征等等,你想知道的概率论与数理统计这张图里都有!赶快跟着这份导图学起来吧!
编辑于2021-05-17 12:00:18参考吴恩达机器学习教程,参考pytorch官方文档和B站Pytorch入门教程,内部机器学习基本知识,pytorch函数,神经网络搭建方法等
这是一篇关于23计算机操作系统的思维导图。该思维导图从计算机系统概述、进程管理、内存管理、文件管理、i/o设备等几个方面进行归纳总结,适用于考研。
这是一篇关于23考研计算机网络原理的思维导图。计算机网络是指将地理位置不同的具有独立功能的多台计算机及其外部设备,通过通信路线连接起来,在网络操作系统、网络管理软件及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统。
社区模板帮助中心,点此进入>>
参考吴恩达机器学习教程,参考pytorch官方文档和B站Pytorch入门教程,内部机器学习基本知识,pytorch函数,神经网络搭建方法等
这是一篇关于23计算机操作系统的思维导图。该思维导图从计算机系统概述、进程管理、内存管理、文件管理、i/o设备等几个方面进行归纳总结,适用于考研。
这是一篇关于23考研计算机网络原理的思维导图。计算机网络是指将地理位置不同的具有独立功能的多台计算机及其外部设备,通过通信路线连接起来,在网络操作系统、网络管理软件及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统。
概率论
一,随机事件和概率
I.随机事件,事件的关系和运算
随机事件
重复进行;结果可知且不唯一;结果无法预知
事件关系
相等
A=B
包含(A发生B必然发生)
互斥(互不相容)
AB=ø
对立
A∪B=Ω,A∩B=ø
事件运算
并/和
A∪B或A+B
交/积
A∩B或AB
差
A-B
非/bar
事件的运算规律
II.概率及概率公式
概率
定义
概率性质
条件概率
事件A发生下事件B发生的概率
独立性
两个事件
P(AB)=P(A)P(B)
三个事件
P(AB)=p(A)P(B)P(AC)=p(A)P(C)P(BC)=p(B)P(C)P(ABC)=p(A)P(B)P(C)
五大公式
加法公式:P(A∪B)=P(A)+P(B)-P(AB)
P(A∪B∪C)=P(A)+P(B)+P(C)-p(AB)-P(AC)-P(BC)-P(ABC)
减法公式:P(A-B)=P(A)-P(AB)
乘法公式:若P(A)>0,P(AB)=P(A)P(A|B)
完备事件组:B₁,B₂…满足
全概率公式:对于完备事件组,若有
贝叶斯公式:对于完备事件组,若有
概率无法逆推出事件关系
III.古典概型&伯努利概型
古典概型:P(A)=A中样本数/样本总数
伯努利概型
伯努利实验:每次实验只用两个结果:A和Ã,进行n次为n伯努利实验
二项概率公式:n重伯努利实验发生k次概率为:
考点
1.翻译
2.事件运算(bar)
3.五大公式
4.伯努利概型
二,随机变量及概率分布
I.随机变量及其分布函数
定义
在样本空间Ω上的实质函数X=X(ω),ω∈Ω,称X(ω)为随机变量
离散型随机变量
取值为有线多个或者无穷可数个
概率分布/分布律
分布函数
对任意实数x,X的分布函数:F(x)=P{X≤x},-∞<x<+∞
性质
F单调不降,右连续
P(X=x)=F(x)-F(x-0)
检验是否是分布函数
其它
0≤F(x)≤1
P(x₁<X≤x₂)=F(x₂)-F(x₁)
连续型随机变量
概率密度:f(x),要求非负可积
分布函数:
性质
F(x)连续
F(x)单调不减,因为F'(x)=f(x)≥0
常用分布
0-1分布
可看成单次伯努利实验
X~B(n,p)二项分布
可看成多次伯努利实验
几何分布
则称X为服从参数p的几何分布
超几何分布
则称X为服从参数n,N,M的超几何分布
X~P(λ)泊松分布
k=0,1,2…;常数λ>0
泊松定理
若n↑会导致p↓,则
X~U(a,b)均匀分布
区间(a,b),则X~U(a,b)
区间[a,b],则X~U[a,b]
性质
落入[c,d]可能性为该区间长度与[a,b]的比例
X~E(λ)指数分布
性质:无记忆性
P{X>t}=P{X>t+s | X>s }=e^(-λt)
X~N(μ,σ²)正态分布又叫高斯分布
标准正态分布:X~N(0,1)时,分布函数
正态分布标准化:
Φ(-x)=1-Φ(x),Φ(0)=1/2
性质
随机变量函数Y=g(x)的分布
离散型
Y也是离散型,此时只需要根据分布律写出P{Y=g(xk)}=pk
连续型
公式法
f=g(x)单调,导数不为0的可导函数,h(y)为它的反函数,(α,β)为x可能区间上的值域
定义法
此章节均为基础知识,所有带星号都应牢牢掌握
三,多维随机变量及其分布
二维随机变量及分布
二维随机变量
定义
性质
F(-∞,y)=F(x,-∞)=F(-∞,-∞)=0,F(+∞,+∞)=1
F(x,y)关于x,y单调不减右连续
P{a<X≤b,c<Y≤d}=F(b,d)+F(a,c)-F(b,c)-F(a,d)
概率分布/分布律:
边缘分布
条件分布
二维离散型
边缘分布:
对应j个元素的和
对应i个元素的和
条件分布:
二维连续型
定义
性质
(X,Y)落在D内的概率为
边缘密度
条件密度
f(x,y)在点(x,y)连续,fY(y)连续且fY(y)>0,则
考点
随机变量的独立性
定义
F{x,y}=FX(x)FY(y)
充要条件
离散型:
连续型:
均匀和正态
二维均匀分布
定义:如果A为有界区域的面积,如果概率密度为
二维正态分布
概率密度
若xy无关
性质
X,Y相互独立的充分必要条件:ρ=0
两个随机变量Z=g(X,Y)的分布
X,Y均离散
X,Y均连续
X离散,Y连续
把X用全概率公式展开
Z=max{X,Y}
等价于X和Y都不大于z
Z=min{X,Y}
等价于X和Y都不小于z
考点
考点
先考虑范围,再考虑端点
定义域的扩展与缩小
考虑端点符号是<还是≤
四,随机变量的数字特征
数学期望与方差
E(X)
离散型
连续型
性质
E(C)=C
E(CX)=CE(X)
E(X±Y)=E(X)±E(Y)
如XY独立,E(XY)=E(X)E(Y)
随机变量函数
Y=g(X)
离散
连续
Z=g(X,Y)
离散
连续
D(X)
标准差
性质
D(C)=0
D(aX+b)=a²D(X)
XY相互独立,D(X±Y)=D(X)+D(Y)
常见
X~B(n,p)二项分布
E(X)=np
D(X)=np(1-p)
X~P(λ)泊松分布
E(X)=λ
D(X)=λ
X~U(a,b)均匀分布
E(X)=(a+b)/2
D(X)=(b-a)²/12
X~E(λ)指数分布
E(X)=1/λ
D(X)=1/λ²
X~N(μ,σ²)正态分布
E(X)=μ
D(X)=σ²
矩协方差和相关系数
矩
k阶原点矩
E(X^k)
k阶中心矩
E{[X-E(X)]^k}
k+l阶混合矩
k+l阶混合中心矩
第7章会涉及到
cov(X,Y)-协方差
cov(X,Y)=E{[X-E(X)][Y-E(Y)]}
性质
展开形式:cov(X,Y)==E(XY)-E(X)E(Y)
D(X ± Y)=D(X) + D(Y) ± 2cov(X,Y)
cov(X,Y)=cov(Y,X)
cov(aX+c,bY+d)=abcov(X,Y)
cov(X₁+X₂,Y)=cov(X₁,Y)+cov(X₂,Y)
相关系数
如果D(X)D(Y)=0则
性质
独立与不相关
独立→不相关,反之不成立
对二维正态(X,Y),相互独立,不相关,ρ=0三者互为充要条件
考点
几乎全是考点
尤其掌握常见分布
五,大数定理和中心极限定理
切尔雪夫不等式
E(X),D(X)存在,对任意ε>0,有
依概率收敛
X₁,X₂…为随机变量序列,A为常数,若对任意ε>0有
切尔雪夫大数定理
X₁,X₂…两两不相关,方差收敛于常数,则对任意ε>0
伯努利大数定理
X~B(n,p),n=1,2…,对于任意ε>0
辛钦大数定理
X₁,X₂…独立同分布,期望E(X)=μ,则对任意ε>0
根据条件判断用哪个定理第七章一致性用得上
拉普拉斯中心极限定理
X~B(n,p),n=1,2…,对于任意X有
林德伯格中心极限定理
X₁,X₂…独立同分布,期望E(X)=μ,D(X)=σ²,则对任意实数x有
近似看做
考点
考的很少
考前背一下
之间联系去理解
六,数理统计的基本概念
基本知识
总体
总体
随机变量
总体分布
X的概率分布
总体数字特征
X数字特征
个体
总体中的每个元素
样本
简单随机样本(样本)
X1,X2…Xn独立同分布
样本容量
n
样本值(观测值)
x1,x2,…xn
统计量
样本均值
样本方差
其他
标准差S
k阶原点矩
k阶中心矩
性质
E(X拔)=E(X)=μ
D(X拔)=D(X)/n=σ²/n
E(S²)=D(X)=σ²
以概率分布
必考
*数学三*
经验分布函数
30+年未考
数学三
常用抽样分布
χ²分布(χ²~χ²(n))读作卡方分布
X₁,X₂,…,Xn相互独立服从N(0,1),记作χ²~χ²(n)(典型模式)
性质
E(χ²)=n,D(χ²)=2n
χ₁²~χ²(n₁),χ₂²~χ²(n₂),χ₁²与χ₂²相互独立,χ₁²+χ₂²~χ²(n₁+n₂)
α分位点
见到平方找卡方
t分布(T~t(n))
X和Y相互独立,X~N(0,1),Y~χ(n²),记作T~t(n))(典型模式)
性质
t分布概率密度是偶函数n很大时近似N(0,1)
偶函数t1-α(n)=-tα(n)
α分位点
常作为本章考点
F分布(F~F(n₁,n₂))
X和Y相互独立,X~χ²(n₁),Y~χ²(n₂),记作F~F(n₁,n₂)
正态总体抽样分布
一个正态总体
X~N(μ,σ²),X₁,X₂~Xn是来自总体的样本,样本均值为
X拔与S²独立,且
两个正态总体
X~N(μ₁,σ₁²)和Y~N(μ₂,σ₂²),X₁,X₂…Xn和Y₁,Y₂…Yn来自X和Y且相互独立,样本均值分别为X拔和Y拔,样本方差为S₁²和S₂²
σ₁²=σ₂²,则
考点
超高频
X拔,S²,E(X拔)
D(X拔),E(S²)
t分布
χ²分布
中频
一个正态总体
D(S²)=2σ⁴/n-1
F分布
低频
两个正态总体
……
七,参数估计
点估计
点估计
用样本X₁,X₂…Xn构造的估计量θ帽(X₁,X₂…Xn)来估计参数θ称为点估计
估计量
θ帽(X₁,X₂…Xn)
估计值:估计量取得的值
无偏性
如果E(θ帽)=θ,称θ帽是θ的无偏估计量。
有效性
如果θ₁帽和θ₂帽都是无偏估计量,且D(θ₁帽)≤D(θ₂帽),则称θ₁帽比θ₂帽更有效,或者是它的更有效估计量
一致性
如果θ帽依概率收敛于θ,则称θ帽是θ的一致估计量
数学一
估计量的求法和区间估计
矩估计法
此为l 阶矩估计,常用1阶矩估计一阶无参数再上升到2阶
最大似然估计法
1.
2. 一阶求导
二阶求偏导
3. 提示:通过求导不一定能求出θ的具体值,此时需要进一步判定若导数大于0,说明单调递增,取θ能取到的最大值若导数小于0,说明单调递减,取θ能取到的最小值
必考
最大似然估计要L(θ)取最大值当导数没有零点时,根据3求值例:当样本为[0,θ]均匀估计样本样本值为x1x2…xn时,若求导<0则θ应该max{x1x2…xn}。解释,θ≥样本值,取样本最大值作为θ就是θ的最小取值
区间估计
置信区间P{θ₁<θ<θ₂}=1-α
称随机区间(θ₁,θ₂)为参数θ的置信水平为1-α的置信区间
区间下限:θ₁区间上限:θ₂
置信水平(置信度):1-α
区间包含参数的概率
一个正态的区间估计
求μ
已知σ²
错误
已知σ²
求σ²
未知μ
已知μ
解题步骤
1. 确定统计量T
2. 给出T的置信范围
3. 代入T到置信范围
二个正态的区间估计
几乎不考
数学一
八,假设检验*数学一*
假设
基本假设H0
可以加上备选假设
两类错误
第一类错误(弃真)拒绝真实的假设
第二类错误(纳假)接受不真的假设
假设检验
根据样本辨别H0的真伪,做出拒绝或者接受的决定
显著性检验
显著性水平(检验水平)
犯第一类错误的概率α
表现对第一类错误的控制程度值越小表示控制越好
显著性检验
只控制第一类错误概率α的检验
解题步骤检验步骤
1. 提出假设H0或者
2. 确定统计量U
3. 确定拒绝域
4. 代入T到置信范围
和置信区间求解对比
拒绝域
单测检验(例如H0:λ<40;H1λ≥40)
拒绝域为α/2
双侧检验(例如H0:λ=40;H1:λ≠40)
拒绝域为α
考点
临界点:拒绝域的边界
一个正态的区间检验
求μ
已知σ²
统计量
已知σ²
求σ²
未知μ
已知μ
确定拒绝域
二个正态的区间检验
几乎不考
考点
弄清楚单测分布(α)与双侧分布(α/2)
搞懂第一类错误
注意大纲规定与部分教材的区别
概率分布F(x)=P(X≤x)
有的书本是X<x
指数分布
有的书本可能是1/λ
样本方差
有的书本可能是1/n