导图社区 连续型随机变量
这是一篇关于连续型随机变量的思维导图,许多随机变量的可能取值的个数是不可数的,可以视为一个或多个区间中无穷不可数个点的随机变量,这类变量被称为连续型随机变量。
这是一篇关于特殊人群的营养的思维导图,包含孕妇和乳母的营养与膳食、 特殊年龄人群的营养与膳食等。
这是一篇关于中华人民共和国医师法的思维导图,包含了考试和注册、 执业规则、 考核和培训、保障措施、 法律责任等。
这是一篇关于中华人民共和国国境卫生检疫法的思维导图,包含卫生检疫、 传染病监测、卫生监督与卫生处理、法律责任等。
社区模板帮助中心,点此进入>>
小儿常见病的辩证与护理
蛋白质
均衡饮食一周计划
消化系统常见病
耳鼻喉解剖与生理
糖尿病知识总结
细胞的基本功能
体格检查:一般检查
心裕济川传承谱
解热镇痛抗炎药
连续型随机变量
5.1 连续型随机变量
5.1.1 连续型随机变量的概念
许多随机变量的可能取值的个数是不可数的,可以视为一个或多个区间中无穷不可数个点的随机变量,这类变量被称为连续型随机变量(continuous random variable)
连续型随机变量的一切可能取值充满某个区间(a,b),即在这个区间内有无穷不可数个数值,因此概率分布不用分布列的形式,而是概率密度函数
5.1.2 连续型随机变量的分布函数
概率密度函数(probability density function,pdf)
连续型随机变量X的分布函数(distribution function)
对任意x1≤x2,,取值于区间[x1,x2]上的X对应的概率是由概率密度曲线f(x)在该区间上所围成的曲边梯形的面积
连续型随机变量的分布函数基本性质
F(x)是区间(-∞,+∞)上的连续函数
F(x)是不减函数,即对任意实数x1<x2,都有F(x1)<F(x2)
0≤F(x)≤1,F(-∞)=0,F(+∞)=1
5.1.3 连续型随机变量的数字特征
连续型随机变量数字特征的定义和含义完全类似于离散型随机变量,只是在连续型随机变量数学期望的定义中用密度函数f(x)替代分布列{P(xk)},用积分式代替求和式
设连续型随机变量X的概率密度函数为f(x)
期望
方差
标准差
5.2 正态分布(normal distribution)
5.2.1 正态分布的概念
定义
位置参数(location parameter):期望μ,决定正态分布的中心位置或平均水平
尺度参数(scale parameter):方差,决定分布的形态。小值对应的正态曲线高而窄,大值对应的正态曲线低而宽
特点
f(x)的图形类似于一个“钟形”曲线,曲线关于X=μ对称,并在X=μ时曲线达到最高点,说明变量在μ附近取值最为密集
曲线无论怎样向两侧延伸,都不会与x轴相交,即x轴是它的渐近线
曲线在μ±σ处有拐点,所谓拐点是指曲线的凹凸性发生变化的点
经验法则
约68%个体的取值在区间[μ-σ,μ+σ]之内,即任一个体落入此区间的概率为0.68
约95%个体的取值在区间[μ-1.96σ,μ+1.96σ]之内,即任一个体落入此区间的概率为0.95
约99%个体的取值在区间[μ-2.58σ,μ+2.58σ]之内,即任一个体落入此区间的概率为0.99
5.2.2 标准正态分布
定义:对任一随机变量X~N(μ,σ2),都可经过线性变换U=(X-μ)/σ得到新随机变量U,称U为标准正态随机变量,表示正态随机变量X和它的期望μ之间以标准差σ为单位的距离,服从期望为0和方差为1的正态分布,此分布称为标准正态分布(standard normal distribution),记为U~(0,1)
标准正态分布的概率密度函数
特征
曲线关于u=0对称,即φ(u)=φ(-u),并在u=0处,φ(u)达到最大值
曲线在u=±1处有拐点
曲线和横轴所围的总面积等于1
P(a≤X≤b)的计算
u=1,P(-1≤U≤1)=0.68
u=1.96,P(-1.96≤U≤1.96)=0.95
u=2.58,P(-2.58≤U≤2.58)=0.99
5.2.3 数据正态性的判定
频数(频率)分布直方图或茎叶图,若数据是近似正态的,则图的形状会与正态曲线相似
正态概率图,若数据是近似正态的,则在P-P图或Q-Q图上散点将会近似地落在一条直线上
P-P图:以实际观测值的累积频率(概率)为横坐标,理论分布累积概率为纵坐标绘制的散点图
Q-Q图:以实际观测值或其标准正态转换分位数值为横坐标,理论分位数值为纵坐标绘制的散点图
矩法(动差法):根据矩的原理推导出偏度系数g1和峰度系数g2,它们是判定正态分布的两个专用统计指标
偏度(skewness)系数:用来描述变量取值分布形态的统计量,指分布不对称的方向和程度。g1>0分布为正偏或右偏;g1<0分布为负偏或左偏;g1=0分布为对称
峰度(kurtosis)系数:用来描述变量取值分布形态陡缓程度的统计量,指分布图形的尖峭程度或峰凸程度。g2>0为高峰度,比正态分布的峰陡峭;g2<0为低峰度,比正态分布的峰要平坦;g2=0分布为正态峰
g1和g2为样本统计量,存在抽样误差。只有当g1和g2都不显著低偏离0时,才可认为资料近似服从正态分布
5.3 正态分布的应用
5.3.1 二项分布的正态近似
如果X~B(n,p),np≥5且nq≥5,则概率P(a≤X≤b)可以被正态分布N(np,npq)曲线下从a-0.5到b+0.5的面积所近似
连续型校正(对任何离散分布用正态近似时都适用)
5.3.2 泊松分布的正态近似:泊松分布在参数λ≥10时,泊松分布近似正态分布,此时泊松分布的期望及方差可作为近似正态分布的期望和方差
5.3.3 医学参考值范围的确定
医学参考值范围(medical reference range):医学上常要确定某特定的“正常”人群(排除了对所研究指标有影响的疾病和有关因素的特定人群)的解剖、生理、生化指标及组织代谢产物等数据中大多数个体取值的波动范围,称为医学参考值范围
实践中,人们常用某项指标95%个体的取值范围作为该指标的医学参考值范围
制定方法
正态分布法:适用于正态或近似正态分布资料
单侧(1-α)*100%的界限值为
双侧(1-α)*100%的界限值为
百分位数法:适用于任意分布的资料
双侧95%的医学参考值范围是(P2.5,P97.5)
单下侧界值是P5
单上侧界值是P95