导图社区 概率与统计
这是一篇关于概率与统计的思维导图,主要内容包括:规律与应用,概率,统计。将知识点进行了归纳和整理,帮助学习者理解和记忆。直击重点,可以作为学习笔记和复习资料,帮助大家系统地回顾和巩固所学知识,知识点系统且全面,希望对大家有所帮助!
编辑于2024-06-24 08:31:10概率与统计
统计
获取数据
途径
普查
普查又称全面调查,即对需要调查的对象进行逐个调查.
优点:数据全面且可靠
缺点:费时费力、具有破坏性的调查不能普查
抽查
从调查对象的总体中,抽取若干个个体进行调查.
优点:省时省力、适用范围广
缺点:所获取的数据与真实情况之间存在一定的误差
几个概念
总体与个体
总体:把调查对象的全体叫作总体
个体:组成总体的每一个调查对象
样本
从总体中抽取的一部分个体就称为总体的一个样本
样本也叫作观测数据
样本容量
样本中包含的个体数目称为样本容量
随机抽样
概念
如果在抽样过程中,能使总体中的每个个体都有相同的可能性被选入样本,那么这样的抽样叫做随机抽样
分类
简单随机抽样
概念
一般地,设一个总体含有N个个体,从中抽取n(n£N)个个体作为样本,如果总体内的每个个体都有相同的可能性被抽到,则把这样的抽样方法称为简单随机抽样
分类
放回简单随机抽样
不放回简单随机抽样
抽签法
随机数法
分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法叫做分层随机抽样.
层
每一个子总体称为层
比例分配
每层样本的量都与层的大小成比例
目的
根据样本提供的信息推断总体的特征
分析、处理数据
图表
柱形图(条形图)、折线图、扇形图、茎叶图、频数分布直方图、频数分布折线图
打点图(点状图)、雷达图
频率分布表
第1列:分组
第2列:频数
第3列:频率
第4列:
频率分布直方图
(1)求极差
最大值与最小值的差
(2)决定组距与组数
组距尽可能取整,组数不宜过少或过多
(3)将数据分组
尽量取整,左闭右开区间,最后一组一般是闭区间
(4)列频率分布表
(5)画频率分布直方图
确定好横轴与纵轴的间距,美观大方
频率分布折线图
将频率分布直方图中的左边和右边各延长一个分组,取各相邻小矩形上底边的中点,用线段顺次连接各段,就得到频率分布折线图.
估计总体
用样本估计总体的集中趋势
众数
样本中出现次数最多的数
众数可能有多个,也可能没有
频率分布直方图中的众数
频率分布直方图中最高那一组的中点值
中位数
方法1
当数据的个数是奇数时,处于中间位置的数就是中位数
当数据的个数是偶数时,则中间两个数的平均数即为中位数
方法2
第50百分位数
频率分布直方图中的中位数
画一条竖线,将频率分布直方图一分为二,使得左右两边的面积分别为0.5,那条竖线的横坐标即为中位数
百分位数
概念
一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
四分位数
第25百分位数(第一四分位数)、第50百分位数(中位数)、第75百分位数(第三四分位数)
计算
第1步
按照从小到大的顺序排列原始数据
第2步
第3步
若i不是整数,而大于i的比邻整数位j,则第p百分位数为第j项数据
若i是整数,则第p百分位数为第i项与第i+1项数据的平均数
平均数(均值)
求和符号
读作“西格玛”
性质
定义
分层抽样的均值
两层
多层
频率分布直方图中的均值
用样本估计总体的离散程度
极差
一组数据中的最大值和最小值统称为极值,将最大值与最小值的差称为极差
方差
定义
分层抽样的方差
两层
多层
频率分布直方图中的方差
标准差
标准差是方差的算术平方根
定义
概率
概念
随机现象
在条件相同的情况下,不同次的试验会得到不同的结果,每一次试验之前不能确定会出现哪种结果,这种现象称为随机现象.
随机试验
对随机现象进行试验、观察或观测称为随机试验.
样本点
我们把随机试验的每个可能得基本结果称为样本点.
样本空间
将随机试验全体样本点的集合称为该试验的样本空间.
一般用W表示
有限样本空间
如果样本空间中样本点的个数是有限的,则称该样本空间为有限样本空间.
随机事件
定义
将样本空间W的子集称为随机事件,简称事件.
表示
用大写字母A,B,C等表示
必然事件
W作为自身的子集,包含了所有的样本点,在每次试验中总有一个样本点发生,所以W总会发生,故W为必然事件.
不可能事件
空集Æ不包含任何样本点,在每次试验中都不会发生,故Æ为不可能事件.
基本事件
只包含一个样本点的事件
事件A发生
在每次试验中,当且仅当A中某个样本点出现时,称为事件A发生.
事件的关系与运算
包含
A发生导致B发生,即事件A中的每个样本点都在B中
相等
如果AÍB,且BÍA,则称A与B等价,或称A与B相等
A=B
并事件(和事件)
A与B至少有一个发生
交事件(积事件)
A与B同时发生
互斥事件
A与B不能同时发生
对立事件
A与B有且仅有一个发生
古典概型
概率
对随机事件发生的可能性大小的度量称为事件的概率,事件A的概率用P(A)表示.
定义
(1)有限性:样本空间的样本点只有有限个;
(2)等可能性:每个样本点发生的可能性相等.
具有以上两个特征的试验称为古典概型试验
概率计算公式
一般地,设试验E是古典概型,样本空间W包含n个样本点,事件A包含其中的k个样本点,则定义事件A的概率:
概率的性质与运算
性质1:概率的取值范围
不可能事件
必然事件
性质2:包含
事件包含的样本点多,概率就大
性质3:互斥事件
概率的可加性
性质4:对立事件
性质5:随机事件
一般概率加法公式
事件的相互独立性
事件A发生与否不影响事件B的发生的概率
必然事件W与不可能事件Æ都与任何事件独立.
频率
定义
频率的稳定性
随着试验次数的增大,频率偏离概率的幅度会缩小,即事件发生的频率会稳定于事件发生的概率.因此可以用频率来估计概率.
频率与概率的关系
(1)频率与概率都是随机事件发生可能性大小的定量刻画.
(2)频率与实验次数及具体的试验有关,具有随机性(不确定性)
(3)概率是刻画随机事件发生可能性大小的数值,是一个固定值,不具有随机性.
(4)概率是频率的稳定值、理论值;频率是概率的试验值.
规律与应用
易错点
(1)频率分布直方图中的纵坐标是频率与组距的比值,每一组的频率等于每个小矩形的面积.
(2)对立事件一定互斥,互斥事件不一定对立.即互斥是对立的必要不充分条件,对立是互斥的充分不必要条件
(3)对立事件用集合的观点理解就是补集,用逻辑的观点理解就是命题的否定
(4)弄清楚试验的样本空间,才是解决概率问题的关键.样本空间要不重不漏,按照某种规律一一列举.
(5)古典概型的判断:有限性是前提,等可能性才是本质.
一颗骰子是古典概型,两颗、三颗骰子也是古典概型.
射击一次不是古典概型,射击多次也不是古典概型.
每种结果出现的可能性要相等,射中与射不中的概率是不相等的.
易混点
(1)频率、权重之间存在着密切的关系
(2)放回与不放回
放回
可能会重复抽取,即可能出现某个个体出现多次的情形
不放回
每个个体只能出现一次
(3)有序与无序
有序问题
依次、逐个、先后,与坐标有关,一般是有序的
无序问题
一次性抽取,顺序不影响问题的本质,一般是无序的
规律
德*摩根定律
如果两个事件既是互斥的,也是独立的,那么其中一个事件必然是不可能事件
应用
表格与树状图
两颗骰子、抽取两个、两次试验,这样的问题可以用表格写出试验的样本空间.
抽取三个或者多次试验,这样的问题一般用树状图写出试验的样本空间.
正难则反
在计算概率时,如果正面计算较复杂,一定要考虑其对立事件.
数形结合
表格是树状图在写样本空间的时候可以起到很好的辅助作用.
极限思考
在判断事件之间的关系时,可以代入必然事件和不可能事件进行验证.