导图社区 第二章 随机变量及其概率分布
这是一篇关于第二章 随机变量及其概率分布的思维导图,主要内容包括:重点内容,第三节随机变量的函数分布,第二节 常用分布(B P U E N),第一节 随机变量及其分布函数。
编辑于2024-03-31 23:16:36第二章 随机变量及其概率分布
第一节 随机变量及其分布函数
随机变量

定义X(s)
 样本空间S到实数空间R上的一个映射 X(s):s(样本点——基本事件)在实数轴上的“坐标“(映射)
每一个(结果)样本点->每一个实数(样本空间的实值函数)
以随机变量来表示事件
事件的表示

分类
离散型随机变量
取值为至多可列个的随机变量
可列(可数无穷个—元素可与自然数一一对应的无穷集) 或 有限
连续性随机变量
作用
数学化,理论化
有助于研究联系该结果的数量
简洁准确描述随机事件
注意
离散型/连续型随机变量均指随机变量的取值特点(不是样本点)
离散型随机变量
样本空间的样本点映射到实数空间R上的取值为至多可列个
样本点取值为连续---可能映射--->离散型随机变量
如样本点取值为[0,1] 如果直接按y=x映射,则是连续型随机变量 如果按照[0,0.5]--->0;[0.5,1]--->1 则是离散型
随机变量的分布函数
实际上通过对样本空间映射到实数轴上(S->R1),建立随机现象与实值函数的关系(随机变量),通过研究随机变量的统计规律,来达到研究事件(随机变量描述的事件)概率的目的
研究内容
X的取值所体现的统计规律
即X取不同值所代表的不同事件
P{X≤x}
其他事件都可以通过该事件{X≤x}的有限次基本运算所得到  意义:样本空间X的某一子集的样本点所映射的实数都小于等于一个给点值x
定义

意义
坐标X(s)落在(负无穷,x](事件)的概率
充要条件
重要三条

1. 单调不减
2. x->正(负)无穷的概率
F(负无穷)=0
空集
F(正无穷)=1
充满整个实数轴
3. 右连续函数

0≤F(x)≤1(易遗漏)(通过重要三条的1、2可推)
注意
随机变量{X取某点值}的概率
 分布函数在该点的左右极限之差 分布函数右连续 F(a) = F(a+0)
区别

离散型随机变量的分布律

研究对象
P{X=xk}=?
只需研究离散随机变量每个离散取值的概率
特点

任意一个事件只涉及至多可列个事件
不同取值事件是互斥
表示方法

性质(充要条件)

非负性
规范性(常用于验证随机变量的分布律是否正确)
 互斥事件概率之和等于互斥事件和事件的概率
分布函数(累积)的特点
阶梯函数(阶梯数为有限个或可列个)

解题步骤
1. X的取值个数 =(确定) 跳跃点的个数
2. 分段数 = 跳跃点个数+1
3. 分段区间的定义域为左闭右开[)
连续型随机变量及其分布
1. 定义(X的分布函数可表示成非负可积函数的变上限积分)

2. 密度函数的性质
充要条件
 分布函数的充要条件推出密度函数f(x)成为某一连续型随机变量的概率密度充要条件
非负性

-∞->+∞的积分为1

分布函数的导数=密度函数(f(x)的连续点处)
证明: 积分中值定理 极限思想 sita∈[x,x+△x](△x->0),sita->x f(x)在该点连续,极限值=函数值  作用: 知分布函数求密度函数(微分) 知密度函数反求分布函数(积分)
P{X取值范围} = 密度函数在对应区间上的积分

3. 注意
连续型随机变量的分布函数总是连续,但不一定处处可导
连续型随机变量的密度函数不一定连续
连续型随机变量某一点处的概率为0
 连续型随机变量某一点处的概率:分布函数在该点左右极限之差
密度函数不唯一
分布函数不可导处,密度函数随便定义——因为一点的概率为0;所以一点的概率密度不会影响整个密度函数的积分为1
重点内容
连续型随机变量函数的分布
常用分布
离散型/连续型随机变量与样本空间样本点关系
样本空间为有限个点-->对应出来肯定是有限个 样本空间为无限个点-->也有可能对应出来是无限个
第二节 常用分布(B P U E N)
定义、记号、参数、名称、特点、背景、E(X)、D(X)
离散型分布
伯努利概型(重要-唯一可自己建模)
0-1分布/两点分布/伯努利分布
表示

用途
表示两个状态的问题(随机试验的结果只有两个)
二项分布(n重伯努利试验)
表示

X~B(n,p)
用途
关心"成功"在n次试验中出现次数的概率,而不关心其次序
适用范围
有放回抽样
样本空间很大(n很大),但抽出样品数目很少的无放回抽样
此时成功率p变化不大,近似认为常数
两个要素(重复独立)
重复:成功率p为常数
多次伯努利试验之间独立
每次试验中不相互影响,可用乘法公式
泊松分布(重要)

定义(X取值从0开始)

特点
e^x的麦克劳林展开(助记)
分布律的性质:X的所有可能取值概率之和为1 
泊松定理

几何分布
首次成功:分布由等比数列(几何级数)表达,参数为p(成功概率)的几何分布 
超几何分布
m(=r+b)总样本点数 r 关心的样本数 n 每次取多少个样本  
连续型分布(重要)
均匀分布

定义

特点
密度函数在某一区间上恒为常数(均匀)
刻画区间上等可能的问题
[a, b]上的均匀分布在[a, b]内任意小区间取值的概率只与小区间的长度有关,而与其位置无关。
计算技巧
随机变量X落入区间[c,d]的概率等于该区间长度与[a,b]长度之比 密度函数在某一区间上恒为常数(均匀)--->密度函数与X轴围城的面积即为概率---->面积(概率)的大小取决底边长度(矩形的面积= 底(区间长度) ×高(一定)) 
指数分布(需手算积分)

定义

背景
通常用来描述生命周期(生物、产品等)
 越长寿,密度函数越小(x越大,f(x)越小) θ越大,平均寿命越大,曲线的下降速率越慢(衰减更慢)
特点

无记忆性
 证明:  作用:电子元器件无论使用多久,剩下的寿命和与把它看成新产品使用所拥有的寿命一致
正态分布
定义
 该形式为密度函数,证明:word文档 1.利用二重积分的变换求积分值 2.对原密度函数进行变量变换
性质

关于μ对称
x=μ±σ是f(x)的拐点
钟型曲线:f(x)极值点向右,曲线的一阶导数:0->下降又上升->0(一阶导数存在极值点,即函数存在拐点)
重点
标准正态、标准化的图像、密度函数证明
 
标准正态分布函数Z~N(0,1)
  证明:X的标准化->变量代换->换元必换限 目的:由于正态分布的密度函数积分得不到解析表达,只能作数值积分,而μ,σ变化则会使表格变得很复杂,所以作变换(X的标准化),使Z~N(0,1),这样做出来的分布函数只与x的取值有关 用途:将问题中X~N(μ,σ2)转换Z~N(0,1)
目的(简化计算)
计算标准正态分布的积分,从而代替原非标准正态分布积分的计算
x<0时分布函数如何求(对称性)?

查表(积分不出)
应用(定参数)
知对应点,求概率值
例子
 
知概率值,求对应点

例子

解题思路

关键:标准化、对称性、定参数
第三节随机变量的函数分布
前提

已知随机变量X及其分布和Y=g(X),求Y的分布
定义法要点
定义
范围
决定因素(需预先判断范围)
本身结构
 x^2 ≥ 0 ---> x^2 < 0 的概率为0 ---> y<1 Y的分布函数取值为0
密度函数f(x)
在f(x)>0的区间,随机变量X ---> 取值的概率才不为0(密度函数在这些范围上的积分不为0) ---> 才是g(X)的定义域(这些区间上的X才有可能取得)
离散:取值范围
连续:积分范围(注意g(X)是否单调且增(减))
g(X) ≤ Y ---单调增--> 利用反函数则很容易求出 X ≤ g^(-1)(Y)
端点(最后处理——连续性)
随机变量X的类型
离散型Y

求出每个X对应Y的取值,并取对应概率
合并所有相同的Y(g(Xk)),并将其对应的概率相加(整理)
连续型Y
公式法
Y=g(X)是严格单调函数(单调增OR单调减) 单调减:X≥h(y)。变为1-Fx(h(y)),又因为h(y)求导应该小于0,所以负负得正,直接写绝对值
证明
  注意:严格单调包括严格增和严格减 严格减的证明注意变号
定义法

从分布函数着手

对分布函数求导
例题P224 例1、2、3+课本