导图社区 第六章
专升本,统计学第六章。概率及基本运算、随机实验要有“可重复性”和“随机性”这两个特点、在随机实验中,可能发生、也可能不发生的事件我们称之为随机事件。
专升本,统计学第七章、虚无假设是“当前样本所属的总体与原设总体一样” 的假设,即虚无假设必须是“无差异”或“变量之间相 互无关、彼此独立”的假设。
专升本,统计学第五章。相关关系主要用于考察分析两个或多个变量之间的相关情况。本文主要是自己对于相关分析的总结,细节之处可能不够详细。如果有朋友有任何疑问或想法,欢迎随时交流讨论~
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
第六章
概率及基本运算
必然现象
在一定条件(S)下,必然发生或者必然不发生的现象
随机现象
在总体上呈现出一定的规律性,称统计规律
概率论是研究随机现象的统计规律性的一门数学学科
随机实验要有“可重复性”和“随机性”这两个特点
在随机实验中,可能发生、也可能不发生的事件我们称之为随机事件
随机事件的运算及其性质
1,复杂的事件往往可以分解为同一个随机现象下的较为简单的事件
不能够再分解的事件称为基本事件,由这些基本事件复合而成的事件我们称之为复合事件
事件A与事件B不能在一次实验中同时发生,则称事件A和事件B是互不相容的
2,每一个可能的结果称之为一个样本点 ω
由全体样本点组成的集合我们称之为样本空间 Ω
随机事件是Ω的子集
3,若事件A发生必然导致事件B发生,则我们称之为事件B包含事件A
B⊇A或A⊆B
事件A与事件B相等,指同一个事件
A=B
4,事件A与事件B中至少有一个发生的事件,我们称之为事件A与事件B的和或并
A∪B或A+B
事件A发生,而事件B不发生的事件,我们称之为事件A与事件B的差
A-B
5,“A不发生”的事件称之为事件A的对立事件
~A
概要
概率及其性质与运算
概率的统计定义
在相同条件下重复进行n次实验,事件A在n次实验中发生m次。若试验次数增大时,事件A发生的频率m/n稳定地在一常数p附近摆动,且n越大,摆动的幅度越小,则我们称常数p为事件A发生的频率,记为P(A)=p
概率的古典定义
等可能性、完备性、互不相容性是古典概型中基本事件的主要特征
概率的公理定义
每个事件A都有一个实数P(A)与之对应,则称P(A)为事件A的概率,如果它满足
(1)0 ≤ P(A)≤ 1
(2)P(Ω)=1
柯尔莫哥洛夫提出了概率论的公理化结构
☆概率分布
离散随机变量的概率分布
两点分布
二项独立实验与二项分布
(1)一次独立的实验只有两种可能的结果:A或~A
(2)每一次实验都是在相同的条件下进行的,且P(A)=p
(3)实验共进行n次,并且n是事先确定的
(4)各次实验是相互独立的,即各次实验结果彼此间互不影响
如果随机变量X的取值是二项独立实验中随机事件A出现的次数,那么,X共有n+1种可能的取值:0,1,2…,n,并且随机变量X遵从二项分布
连续随机变量的概率分布
正态分布是最常见、应用也最为广泛的一种重要的连续型分布
“中间大,两头小,左右对称”这种性质
(一)正态分布及其基本性质
☆正态曲线基本性质
标准差不同时,正态曲线呈现的位置和形状也不同
高斯在《天体运动理论》末尾,以极其简单的手法推导出了正态分布,并用最小二乘法加以验证,正态分布又被称为高斯分布
(二)标准正态分布
当均值μ=0,标准差σ=1时的正态分布均为标准正态分布,记作N(0,1)
标准正态曲线在Z=0时达到最大值
任何一般的正态分布都可以化为标准正态分布
(三)标准分与正态分布表
如果标准分是正数,表示高于总体平均数μ,如果标准分是负数,则表示x低于总体平均数μ
标准分能够准确地报告出原始分在数据总体中的相对地位
正态分布表,就是依赖标准正态分布的有关概率编制成的一张数表
(四)正态分布的应用
若考试成绩服从正态分布,确定考试录取分数线
确定在正态分布下特定分数界限内的考生人数
☆抽样分布
样本统计量的概率分布
的分布
的抽样分布渐近正态。原始数据X的总体分布是正态的,样本平均数?的抽样分布就一定是正态的
(2)样本平均数?在抽样分布中的平均数,等于原始数据中的总体平均数,即
(3)样本平均数?在抽样分布中的标准差,也就是样本平均数的标准误
的标准分
X²分布(卡方)
以n为自由度的X²分布记为X²(n)
☆基本特点
(1)X²分布是一个正偏态分布,自由度df→∞时,即为正态分布
(2)X²值都是正值
(3)k个X²分布的和也是X²分布,X²分布具有可加性
(4)X²分布的平均值与方差。若df>2,则X²分布的平均数μx²=df,方差σ²x²=2df
(5)X²分布是连续型分布,但有些离散型的分布也近似于X²分布
(6)当X服从正态分布时,即X~N(μ,σ²),x₁,…,n。此时
服从自由度为n的X²的分布
t分布
种形对称的,中心最高,两边迅速下降,两端无穷延伸
自由度越小,t分布曲线与Z分布曲线的差别越大,t分布曲线的中部就更趋于平坦,而两边的尾端就相对地越高
自由度越大,t分布曲线的形态越接近于标准正态分布
当自由度等于无穷大时,t分布曲线才与标准正态曲线完美重合
F分布
两个总体X,Y,X与Y相互独立,随机变量
是服从第一自由度为n₁,第二自由度为n₂的F分布,记为F~Fα(n₁n₂)
参数估计
总体参数无法直接得到,抽取的部分个体作观察获取数据,通过统计量来估计参数
点估计
用样本统计量直接去代替对应的总体参数,用样本平均数/X作为总体平均数μ的估计值
抽样分布的标准误
的点估计值就是
估计量的无偏性、有效性、一致性是衡量点估计值优劣的标准
区间估计
一个单一数值
随机抽样,可能不是总体参数的真正数值
与点估计不同,它得出的不是一个单一的数值,而是一个范围。
区间估计既告诉我们参数的真正数值在什么范围内,又告诉我们做出如此结论的把握性之大小
1,总体标准差σ已知
总体服从正态分布
2,总体标准差σ未知
当总体服从正态分布时,无论样本容量的大小,都服从自由度为n-1的t分布
总体不服从正态分布,且总体标准差未知,当样本容量n≥30
小于30无法计算,是正态分布可以计算
置信区间的大小在样本容量n一定的情况下与置信度有关:置信度越大,置信区间也越大;置信度越小,置信区间也相应地越小。
在实际应用中,当样本容量n一定时,要提高置信度(1-α),就将会增大置信区间,但若置信区间过大,就会失去了参数估计的意义
样本容量的估计
一种合理、可行的抽样方案,一方面要针对调查和实验研究的具体需要选择适宜的抽样方法,另一方面还应该根据调查研究的实际需要所确定的调查研究的精确度等情况来决定样本容量