导图社区 初中数学:统计与概率
中考整体复习:统计与概率知识点梳理,包含:1.统计(①收集数据:普查与抽样调查、总体个体与样本等②整理数据:相关概念、频数分布表、频数分布直方图等③描述数据:统计表与统计图等④分析数据:集中趋势与离散程度等)2.概率(①确定事件与随机事件②相关概念③概率模型④概率的计算方法)
编辑于2021-04-28 16:30:028年级上册数学(苏科)第3章《勾股定理》相关知识点梳理,使用其他版本教材的同学也可以正常使用。可以作为学习笔记和复习资料,帮助大家系统地回顾和巩固所学知识,学生更好地理解和记忆历史知识。
8年级上册数学(苏科)第2章,轴对称图形相关知识点梳理,使用其他版本教材的同学也可以正常使用。可以作为学习笔记和复习资料,帮助大家系统地回顾和巩固所学知识,学生更好地理解和记忆历史知识。
苏科版8年级上册《全等三角形》相关知识点梳理,展示了全等三角形的定义、性质、以及判定条件等多个方面的知识点。这种组织方式使得学习者能够一目了然地掌握全等三角形的核心内容,便于记忆和复习。还介绍了多种全等三角形的判定方法,如“边角边”、“角边角”、“角角边”和“边边边”等,并详细说明了它们的由来、内容、应用格式以及推论。这些信息为学习者提供了丰富的解题技巧和方法,有助于他们在解决实际问题时灵活运用。使用其他版本的同学也可以正常使用。
社区模板帮助中心,点此进入>>
8年级上册数学(苏科)第3章《勾股定理》相关知识点梳理,使用其他版本教材的同学也可以正常使用。可以作为学习笔记和复习资料,帮助大家系统地回顾和巩固所学知识,学生更好地理解和记忆历史知识。
8年级上册数学(苏科)第2章,轴对称图形相关知识点梳理,使用其他版本教材的同学也可以正常使用。可以作为学习笔记和复习资料,帮助大家系统地回顾和巩固所学知识,学生更好地理解和记忆历史知识。
苏科版8年级上册《全等三角形》相关知识点梳理,展示了全等三角形的定义、性质、以及判定条件等多个方面的知识点。这种组织方式使得学习者能够一目了然地掌握全等三角形的核心内容,便于记忆和复习。还介绍了多种全等三角形的判定方法,如“边角边”、“角边角”、“角角边”和“边边边”等,并详细说明了它们的由来、内容、应用格式以及推论。这些信息为学习者提供了丰富的解题技巧和方法,有助于他们在解决实际问题时灵活运用。使用其他版本的同学也可以正常使用。
统计与概率
统计
1. 收集数据
方法
普查与抽样调查
普查与抽样调查
普查
定义
为一特定目的而对所有考查对象所做的调查叫作普查
方法
问卷
访问
电话
抽样调查
定义
为一特定目的而对部分考查对象所做的调查叫作抽样调查
从总体中抽取样本进行调查,然后根据样本推断总体的情况
抽查方法
随机
适用范围
总体中个体较少
每个个体机会相同
抽样方法
随机
系统
适用范围
总体中个体较多
分布均匀
抽样方法
将总体均衡分组
制定抽样规则
每组中有相同个数的个体
分层
适用范围
总体差异明显
抽样方法
按差异分组
按各组所占比例抽样
优缺点
普查
收集到的数据全面、准确
花费多,耗时长;有些调查不宜用全面调查
有时具有破坏性
抽样调查
花费少、省时
收集到的数据不全面
选择调查方式的方法
抽样调查适用情况
调查的对象个数较多,调查不容易进行时
当调查的结果对调查对象具有破坏性,或者会产生一定的危害性时
全面调查适用情况
调查的对象个数较少,调查容易进行时
对调查的结果有特别要求,或调查的结果有特殊意义时,如全国人口普查
总体、个体与样本
总体
把所考察对象的全体叫作总体
个体
把组成总体的每一个考查对象叫作个体
样本
从总体中所抽取的一部分个体叫作总体的一个样本
样本容量
样本中个体的数目叫作样本容量
抽样调查中样本的选取
样本应具有代表性,不偏向某些个体
选取的样本要足够大
避免遗漏某一群体
步骤
明确调查问题
明确调查对象
选择调查方法和调查形式
展开调查
统计并整理调查结果
分析结果并得出结论
2. 整理数据
相关概念
组数
把所有数据分成若干组,分成的组的个数称为组数
组距
每个小组的两个端点之间的距离(组内数据的取值范围)称为组距
组数确定方法
分组
注意
组数适当
组距相等
原则
不重,即一个数据只能在一个组中
不漏,即不能漏掉某一个数据
频数
在统计数据时,各个对象出现的次数有多有少,或者说出现的频繁程度不同,某个对象出现的次数称为该对象的频数
落在各小组内数据的个数
频率
频数与总次数的比值
频数、频率与总个数之间的关系
各对象的频数之和等于数据的总个数
各对象的频率之和等于1
频数÷总个数=频率
频数分布表
概念
将一组数据按一定的要求进行适当分组,经过整理,数据记入到相应的“划记”中,统计出每组中相应数据出现的频数而制作的表格
绘制频数分布表的步骤
计算最大值与最小值
决定组距和组数
确定分点
列频数分布表
特点
能清楚、确切的反映一组数据的大小分布情况
样表

频数分布直方图
概念
根据频数分布表,用横轴表示各分组数据,用纵轴表示各组数据的频数,绘制条形统计图直观地呈现出频数的分布特征和变化规律
组成部分
横轴
表示分组的情况(数据分组)
纵轴
表示频数
条形图
每一条是立于横轴之上的一个长方形,底边长是这个组的组距,高为频数
特点
直观显示频数分布情况
直观反映各组之间频数差异
绘制频数分布直方图步骤
1.计算最大值与最小值的差
2.决定组距和组数
3.列频数分布表
对落在各个小组内的数据进行累计,得到各个小组内的数据的个数(叫作频数),对频数进行整理可得频数分布表
4.画频数分布直方图
根据频数分布表,在平面直角坐标系中,用横轴表示各分组数据,用纵轴表示各组数据的频数绘制条形统计图
样图

条形统计图与频数分布直方图之间的联系与区别
联系
频数分布直方图是特殊的条形统计图
区别
条形统计图用横轴表示考察对象的类别,用纵轴表示不同对象的数量
频数分布直方图用横轴表示考查对象数据的变化范围,用纵轴表示相应范围内数据的频数
条形统计图各个“条形”之间都有间隙,频数分布直方图各个“条形”之间通常没有间隙,但也可以有间隙。
3. 描述数据
方法
统计表
定义
利用表格将要统计的数据填入相应的表格内
特点
可以很好的整理数据
统计图
条形统计图
概念
用一个单位长度表示一定的数量关系,根据数量的多少画成长短不同的条形,条形的宽度必须保持一致,然后把这些条形排列起来,这样的统计图叫作条形统计图。它可以表示出每个项目的具体数量
优缺点
能够显示每组中的具体数据,易于比较数据之间的差别
无法直观的显示每组数据占总体的百分比是多少
扇形统计图
概念
整个圆表示统计项目的总体,每一统计项目分别用圆中不同的扇形来表示,扇形面积占圆面积的百分比与各统计项目占总体的百分比相同。这样的统计图称为扇形统计图
优缺点
易于显示每组数据相对于总数的大小
在不知道总体数量的前提下,无法知道每组数据的具体数量
在扇形统计图
扇形圆心角=该统计项目占总体的百分比*360°
折线图
概念
用一个单位长度表示一定的数据,根据数量的多少描出各点,然后用线段顺次把各点连接起来,这样的统计图叫作折线统计图。它既可以表示出项目的具体数量,又能清楚的反映数据的变化情况
特点
易于显示数据的变化趋势
4. 分析数据
1. 集中趋势
平均数
定义
平均数是指在一组数据中所有数据之和再除以数据的个数.
数据的总和除以数据的总个数
分类
算术平均数

加权平均数
权重
在一组数据中,各个数在总结果中所占的百分数比称为这个数的权重

相同数据的个数叫做权,越大,表示的个数越多,“权”就越重。数据的权重能够反映数据的相对“重要程度”
应用
应用平均数时,所有数据都参加运算,它能充分地利用数据所提供的信息;但当一组数据中存在极大值或极小值时,平均数将不能准确表示数据的集中情况
中位数
定义
一般地,n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数
注意
一组数据的中位数是唯一的.它可以是这组数据中的数也可以是这组数据外的数
计算步骤
将这组数据按从小到大(或从大到小)的顺序排列
找到处在最中间位置的一个数或最中间的两个数的平均数即为中位数
应用
应用中位数时,计算较简单,不会受到极大值或极小值存在的影响,但不能充分利用所有数据信息
众数
定义
一般地,一组数据中出现次数最多的那个数据叫做这组数据的众数
注意
一组数据可以有不止一个众数,也可以没有众数.若几个数据出现的次数相同,并且比其他数据出现的次数都多,那么这几个数据都是这组数据的众数;当所有的数出现的次数一样多时,无众数
应用
应用众数,某些情况下,人们最关心、最重视的是出现次数最多的数据,这种情况下,应用众数简单而且能够直接满足人们的需求,但当各个数据的重复次数大致相等时,众数往往没有特别意义
2. 离散程度
极差
定义
一组数据中最大值与最小值的差
意义
极差反映了一组数据的变化范围,在一定程度上描述了这组数据的离散程度,一般来说,极差小,说明数据的波动幅度小
方差
定义
一组数据中,各个数据与它们的平均数的差的平方的平均数叫做这组数据的方差,记作s²
公式

意义
方差越大,说明这组数据的离散程度越大;方差越小,说明这组数据的离散程度越小
方差越大,数据的波动越大,越不稳定;方差越小,数据的波动越小,稳定性越好
适用情况
在平均数(中位数)相同的情况下,方差越小,则越稳定
标准差
一组数据方差的算术平方根
近似数和有效数字
近似数
利用四舍五入法取一个数的近似数时,四舍五入到哪一位,就说这个近似数精确到哪一位
有效数字
对于一个近似数,从左边第一个不是0的数字起,到精确到的位数止,所有的数字都叫做这个数的有效数字
5. 做出决策
用样本估计总体
做出判断和预测
概率
1. 确定事件与随机事件
可能性的大小
用“一定”表示必然事件
用“不可能”表示不可能事件
用“很可能、可能、不大可能”表示随机事件
确定事件
0:不可能事件
在一定条件下,一定不会发生的事件
:1:必然事件
在一定条件下,一定会发生的事件
随机事件
0~1之间:可能(随机)事件
在一定条件下,无法确定它会不会发生的事件
2. 相关概念
等可能性
一般地,设一个试验的所有可能发生的结果有n个,它们都是随机事件,每次试验有且只有其中的一个结果出现。如果每个结果出现的机会均等,那么我们说这n个事件的发生时等可能的,也称这个试验的结果具有等可能性
每次试验有且只有其中一个结果出现
出现的结果是随机的
每个结果出现的机会均等
概率
一个事件发生的可能性的大小的数值,称为这个事件的概率
3. 表示
如果用字母A表示一个事件,那么P(A)表示事件A发生的概率
必然事件A发生的概率是1,记作P(A)=1
不可能事件A发生的概率是0,记作P(A)=0
随机事件A发生的概率P(A)是0与1之间的一个数
一个随机事件发生的概率是由这个随机事件自身决定的,并且是客观存在的
概率是随机事件自身的属性,它反映这个随机事件发生的可能性大小
4. 概率模型
古典概型
一般地,如果一个试验有n个等可能的结果,当其中m个结果之一出现时,事件A发生,那么事件A发生的概率为

m:事件A发生可能出现的结果数
n:所有等可能出现的结果数
几何概型
定义
以几何图形为模型的一种概率模型,可以转化为等可能条件下的概率(古典概型)
特征
试验结果有无数个
每一次试验出现的结果具有等可能性
几何概型与面积之间的关系

5. 概率的计算方法
频率估计概率
概率的稳定性
通常,在多次重复试验中,一个随机事件发生的频率会在某一个常数附近摆动,并且趋于稳定。这个性质称为频率的稳定性
用频率估计概率
在一定条件下大量重复进行同一实验时,随机事件发生的频率会在某一个常数附近摆动。在实际生活中,人们常把这个常数作为该随机事件发生的概率的估计值
注意
概率是频率的稳定值,而频率是概率的近似值
分析预测概率
列举法
定义
在一次实验中,如果可能出现的结果只有有限个,且各种结果出现的可能性大小相等,就可以通过列举实验结果的方法,分析出随机事件发生的概率
步骤
列举出一次实验的所有可能结果
数出m,n
计算
列表法
定义
当事件中涉及两个因素,并且可能出现的结果数目较多时,用表格不重不漏地列出可能的结果,这种方法叫列表法
步骤
把所有可能发生的实验结果一一列举出来
把所求事件发生的结果都找出来
代入公式计算
树状图法
定义
当事件中涉及的有两个及两个以上的步骤时(尤其是出现了三个步骤时),用树形图的形式不重不漏地列出所有可能的结果的方法叫树形图法
步骤
把所有可能发生的结果用树状图表示出来
把所求事件发生的结果都找出来
带入公式计算
统计与概率
统计
1. 收集数据
方法
普查与抽样调查
普查与抽样调查
普查
定义
为一特定目的而对所有考查对象所做的调查叫作普查
方法
问卷
访问
电话
抽样调查
定义
为一特定目的而对部分考查对象所做的调查叫作抽样调查
从总体中抽取样本进行调查,然后根据样本推断总体的情况
抽查方法
随机
适用范围
总体中个体较少
每个个体机会相同
抽样方法
随机
系统
适用范围
总体中个体较多
分布均匀
抽样方法
将总体均衡分组
制定抽样规则
每组中有相同个数的个体
分层
适用范围
总体差异明显
抽样方法
按差异分组
按各组所占比例抽样
优缺点
普查
收集到的数据全面、准确
花费多,耗时长;有些调查不宜用全面调查
有时具有破坏性
抽样调查
花费少、省时
收集到的数据不全面
选择调查方式的方法
抽样调查适用情况
调查的对象个数较多,调查不容易进行时
当调查的结果对调查对象具有破坏性,或者会产生一定的危害性时
全面调查适用情况
调查的对象个数较少,调查容易进行时
对调查的结果有特别要求,或调查的结果有特殊意义时,如全国人口普查
统计与概率
统计
1. 收集数据
方法
普查与抽样调查
总体、个体与样本
总体
把所考察对象的全体叫作总体
个体
把组成总体的每一个考查对象叫作个体
样本
从总体中所抽取的一部分个体叫作总体的一个样本
样本容量
样本中个体的数目叫作样本容量
抽样调查中样本的选取
样本应具有代表性,不偏向某些个体
选取的样本要足够大
避免遗漏某一群体
步骤
明确调查问题
明确调查对象
选择调查方法和调查形式
展开调查
统计并整理调查结果
分析结果并得出结论
统计与概率
统计
2. 数据整理
相关概念
组数
把所有数据分成若干组,分成的组的个数称为组数
组距
每个小组的两个端点之间的距离(组内数据的取值范围)称为组距
组数确定方法
分组
注意
组数适当
组距相等
原则
不重,即一个数据只能在一个组中
不漏,即不能漏掉某一个数据
频数
在统计数据时,各个对象出现的次数有多有少,或者说出现的频繁程度不同,某个对象出现的次数称为该对象的频数
落在各小组内数据的个数
频率
频数与总次数的比值
频数、频率与总个数之间的关系
各对象的频数之和等于数据的总个数
各对象的频率之和等于1
频数÷总个数=频率
频数分布表
概念
将一组数据按一定的要求进行适当分组,经过整理,数据记入到相应的“划记”中,统计出每组中相应数据出现的频数而制作的表格
绘制频数分布表的步骤
计算最大值与最小值
决定组距和组数
确定分点
列频数分布表
特点
能清楚、确切的反映一组数据的大小分布情况
样表

统计与概率
统计
2. 数据整理
频数分布直方图
概念
根据频数分布表,用横轴表示各分组数据,用纵轴表示各组数据的频数,绘制条形统计图直观地呈现出频数的分布特征和变化规律
组成部分
横轴
表示分组的情况(数据分组)
纵轴
表示频数
条形图
每一条是立于横轴之上的一个长方形,底边长是这个组的组距,高为频数
特点
直观显示频数分布情况
直观反映各组之间频数差异
绘制频数分布直方图步骤
1.计算最大值与最小值的差
2.决定组距和组数
3.列频数分布表
对落在各个小组内的数据进行累计,得到各个小组内的数据的个数(叫作频数),对频数进行整理可得频数分布表
4.画频数分布直方图
根据频数分布表,在平面直角坐标系中,用横轴表示各分组数据,用纵轴表示各组数据的频数绘制条形统计图
样图

条形统计图与频数分布直方图之间的联系与区别
联系
频数分布直方图是特殊的条形统计图
区别
条形统计图用横轴表示考察对象的类别,用纵轴表示不同对象的数量
频数分布直方图用横轴表示考查对象数据的变化范围,用纵轴表示相应范围内数据的频数
条形统计图各个“条形”之间都有间隙,频数分布直方图各个“条形”之间通常没有间隙,但也可以有间隙。
统计与概率
统计
3. 描述数据
方法
统计表
定义
利用表格将要统计的数据填入相应的表格内
特点
可以很好的整理数据
统计图
条形统计图
概念
用一个单位长度表示一定的数量关系,根据数量的多少画成长短不同的条形,条形的宽度必须保持一致,然后把这些条形排列起来,这样的统计图叫作条形统计图。它可以表示出每个项目的具体数量
优缺点
能够显示每组中的具体数据,易于比较数据之间的差别
无法直观的显示每组数据占总体的百分比是多少
扇形统计图
概念
整个圆表示统计项目的总体,每一统计项目分别用圆中不同的扇形来表示,扇形面积占圆面积的百分比与各统计项目占总体的百分比相同。这样的统计图称为扇形统计图
优缺点
易于显示每组数据相对于总数的大小
在不知道总体数量的前提下,无法知道每组数据的具体数量
在扇形统计图
扇形圆心角=该统计项目占总体的百分比*360°
折线图
概念
用一个单位长度表示一定的数据,根据数量的多少描出各点,然后用线段顺次把各点连接起来,这样的统计图叫作折线统计图。它既可以表示出项目的具体数量,又能清楚的反映数据的变化情况
特点
易于显示数据的变化趋势
4. 分析数据
1. 集中趋势
平均数
定义
平均数是指在一组数据中所有数据之和再除以数据的个数.
数据的总和除以数据的总个数
分类
算术平均数

加权平均数
权重
在一组数据中,各个数在总结果中所占的百分数比称为这个数的权重

相同数据的个数叫做权,越大,表示的个数越多,“权”就越重。数据的权重能够反映数据的相对“重要程度”
应用
应用平均数时,所有数据都参加运算,它能充分地利用数据所提供的信息;但当一组数据中存在极大值或极小值时,平均数将不能准确表示数据的集中情况
中位数
定义
一般地,n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数
注意
一组数据的中位数是唯一的.它可以是这组数据中的数也可以是这组数据外的数
计算步骤
将这组数据按从小到大(或从大到小)的顺序排列
找到处在最中间位置的一个数或最中间的两个数的平均数即为中位数
应用
应用中位数时,计算较简单,不会受到极大值或极小值存在的影响,但不能充分利用所有数据信息
众数
定义
一般地,一组数据中出现次数最多的那个数据叫做这组数据的众数
注意
一组数据可以有不止一个众数,也可以没有众数.若几个数据出现的次数相同,并且比其他数据出现的次数都多,那么这几个数据都是这组数据的众数;当所有的数出现的次数一样多时,无众数
应用
应用众数,某些情况下,人们最关心、最重视的是出现次数最多的数据,这种情况下,应用众数简单而且能够直接满足人们的需求,但当各个数据的重复次数大致相等时,众数往往没有特别意义
2. 离散程度
极差
定义
一组数据中最大值与最小值的差
意义
极差反映了一组数据的变化范围,在一定程度上描述了这组数据的离散程度,一般来说,极差小,说明数据的波动幅度小
方差
定义
一组数据中,各个数据与它们的平均数的差的平方的平均数叫做这组数据的方差,记作s²
公式

意义
方差越大,说明这组数据的离散程度越大;方差越小,说明这组数据的离散程度越小
方差越大,数据的波动越大,越不稳定;方差越小,数据的波动越小,稳定性越好
适用情况
在平均数(中位数)相同的情况下,方差越小,则越稳定
标准差
一组数据方差的算术平方根
近似数和有效数字
近似数
利用四舍五入法取一个数的近似数时,四舍五入到哪一位,就说这个近似数精确到哪一位
有效数字
对于一个近似数,从左边第一个不是0的数字起,到精确到的位数止,所有的数字都叫做这个数的有效数字
5. 做出决策
用样本估计总体
做出判断和预测
统计与概率
统计
3. 描述数据
方法
统计表
定义
利用表格将要统计的数据填入相应的表格内
特点
可以很好的整理数据
统计图
条形统计图
概念
用一个单位长度表示一定的数量关系,根据数量的多少画成长短不同的条形,条形的宽度必须保持一致,然后把这些条形排列起来,这样的统计图叫作条形统计图。它可以表示出每个项目的具体数量
优缺点
能够显示每组中的具体数据,易于比较数据之间的差别
无法直观的显示每组数据占总体的百分比是多少
扇形统计图
概念
整个圆表示统计项目的总体,每一统计项目分别用圆中不同的扇形来表示,扇形面积占圆面积的百分比与各统计项目占总体的百分比相同。这样的统计图称为扇形统计图
优缺点
易于显示每组数据相对于总数的大小
在不知道总体数量的前提下,无法知道每组数据的具体数量
在扇形统计图
扇形圆心角=该统计项目占总体的百分比*360°
折线图
概念
用一个单位长度表示一定的数据,根据数量的多少描出各点,然后用线段顺次把各点连接起来,这样的统计图叫作折线统计图。它既可以表示出项目的具体数量,又能清楚的反映数据的变化情况
特点
易于显示数据的变化趋势
4. 分析数据
1. 集中趋势
平均数
定义
平均数是指在一组数据中所有数据之和再除以数据的个数.
数据的总和除以数据的总个数
分类
算术平均数

加权平均数
权重
在一组数据中,各个数在总结果中所占的百分数比称为这个数的权重

相同数据的个数叫做权,越大,表示的个数越多,“权”就越重。数据的权重能够反映数据的相对“重要程度”
应用
应用平均数时,所有数据都参加运算,它能充分地利用数据所提供的信息;但当一组数据中存在极大值或极小值时,平均数将不能准确表示数据的集中情况
中位数
定义
一般地,n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数
注意
一组数据的中位数是唯一的.它可以是这组数据中的数也可以是这组数据外的数
计算步骤
将这组数据按从小到大(或从大到小)的顺序排列
找到处在最中间位置的一个数或最中间的两个数的平均数即为中位数
应用
应用中位数时,计算较简单,不会受到极大值或极小值存在的影响,但不能充分利用所有数据信息
众数
定义
一般地,一组数据中出现次数最多的那个数据叫做这组数据的众数
注意
一组数据可以有不止一个众数,也可以没有众数.若几个数据出现的次数相同,并且比其他数据出现的次数都多,那么这几个数据都是这组数据的众数;当所有的数出现的次数一样多时,无众数
应用
应用众数,某些情况下,人们最关心、最重视的是出现次数最多的数据,这种情况下,应用众数简单而且能够直接满足人们的需求,但当各个数据的重复次数大致相等时,众数往往没有特别意义
2. 离散程度
极差
定义
一组数据中最大值与最小值的差
意义
极差反映了一组数据的变化范围,在一定程度上描述了这组数据的离散程度,一般来说,极差小,说明数据的波动幅度小
方差
定义
一组数据中,各个数据与它们的平均数的差的平方的平均数叫做这组数据的方差,记作s²
公式

意义
方差越大,说明这组数据的离散程度越大;方差越小,说明这组数据的离散程度越小
方差越大,数据的波动越大,越不稳定;方差越小,数据的波动越小,稳定性越好
适用情况
在平均数(中位数)相同的情况下,方差越小,则越稳定
标准差
一组数据方差的算术平方根
近似数和有效数字
近似数
利用四舍五入法取一个数的近似数时,四舍五入到哪一位,就说这个近似数精确到哪一位
有效数字
对于一个近似数,从左边第一个不是0的数字起,到精确到的位数止,所有的数字都叫做这个数的有效数字
5. 做出决策
用样本估计总体
做出判断和预测
统计与概率
统计
1. 收集数据
方法
普查与抽样调查
普查与抽样调查
普查
定义
为一特定目的而对所有考查对象所做的调查叫作普查
方法
问卷
访问
电话
抽样调查
定义
为一特定目的而对部分考查对象所做的调查叫作抽样调查
从总体中抽取样本进行调查,然后根据样本推断总体的情况
抽查方法
随机
适用范围
总体中个体较少
每个个体机会相同
抽样方法
随机
系统
适用范围
总体中个体较多
分布均匀
抽样方法
将总体均衡分组
制定抽样规则
每组中有相同个数的个体
分层
适用范围
总体差异明显
抽样方法
按差异分组
按各组所占比例抽样
优缺点
普查
收集到的数据全面、准确
花费多,耗时长;有些调查不宜用全面调查
有时具有破坏性
抽样调查
花费少、省时
收集到的数据不全面
选择调查方式的方法
抽样调查适用情况
调查的对象个数较多,调查不容易进行时
当调查的结果对调查对象具有破坏性,或者会产生一定的危害性时
全面调查适用情况
调查的对象个数较少,调查容易进行时
对调查的结果有特别要求,或调查的结果有特殊意义时,如全国人口普查
总体、个体与样本
总体
把所考察对象的全体叫作总体
个体
把组成总体的每一个考查对象叫作个体
样本
从总体中所抽取的一部分个体叫作总体的一个样本
样本容量
样本中个体的数目叫作样本容量
抽样调查中样本的选取
样本应具有代表性,不偏向某些个体
选取的样本要足够大
避免遗漏某一群体
步骤
明确调查问题
明确调查对象
选择调查方法和调查形式
展开调查
统计并整理调查结果
分析结果并得出结论
2. 数据整理
相关概念
组数
把所有数据分成若干组,分成的组的个数称为组数
组距
每个小组的两个端点之间的距离(组内数据的取值范围)称为组距
组数确定方法
分组
注意
组数适当
组距相等
原则
不重,即一个数据只能在一个组中
不漏,即不能漏掉某一个数据
频数
在统计数据时,各个对象出现的次数有多有少,或者说出现的频繁程度不同,某个对象出现的次数称为该对象的频数
落在各小组内数据的个数
频率
频数与总次数的比值
频数、频率与总个数之间的关系
各对象的频数之和等于数据的总个数
各对象的频率之和等于1
频数÷总个数=频率
频数分布表
概念
将一组数据按一定的要求进行适当分组,经过整理,数据记入到相应的“划记”中,统计出每组中相应数据出现的频数而制作的表格
绘制频数分布表的步骤
计算最大值与最小值
决定组距和组数
确定分点
列频数分布表
特点
能清楚、确切的反映一组数据的大小分布情况
样表

频数分布直方图
概念
根据频数分布表,用横轴表示各分组数据,用纵轴表示各组数据的频数,绘制条形统计图直观地呈现出频数的分布特征和变化规律
组成部分
横轴
表示分组的情况(数据分组)
纵轴
表示频数
条形图
每一条是立于横轴之上的一个长方形,底边长是这个组的组距,高为频数
特点
直观显示频数分布情况
直观反映各组之间频数差异
绘制频数分布直方图步骤
1.计算最大值与最小值的差
2.决定组距和组数
3.列频数分布表
对落在各个小组内的数据进行累计,得到各个小组内的数据的个数(叫作频数),对频数进行整理可得频数分布表
4.画频数分布直方图
根据频数分布表,在平面直角坐标系中,用横轴表示各分组数据,用纵轴表示各组数据的频数绘制条形统计图
样图

条形统计图与频数分布直方图之间的联系与区别
联系
频数分布直方图是特殊的条形统计图
区别
条形统计图用横轴表示考察对象的类别,用纵轴表示不同对象的数量
频数分布直方图用横轴表示考查对象数据的变化范围,用纵轴表示相应范围内数据的频数
条形统计图各个“条形”之间都有间隙,频数分布直方图各个“条形”之间通常没有间隙,但也可以有间隙。
3. 描述数据
方法
统计表
定义
利用表格将要统计的数据填入相应的表格内
特点
可以很好的整理数据
统计图
条形统计图
概念
用一个单位长度表示一定的数量关系,根据数量的多少画成长短不同的条形,条形的宽度必须保持一致,然后把这些条形排列起来,这样的统计图叫作条形统计图。它可以表示出每个项目的具体数量
优缺点
能够显示每组中的具体数据,易于比较数据之间的差别
无法直观的显示每组数据占总体的百分比是多少
扇形统计图
概念
整个圆表示统计项目的总体,每一统计项目分别用圆中不同的扇形来表示,扇形面积占圆面积的百分比与各统计项目占总体的百分比相同。这样的统计图称为扇形统计图
优缺点
易于显示每组数据相对于总数的大小
在不知道总体数量的前提下,无法知道每组数据的具体数量
在扇形统计图
扇形圆心角=该统计项目占总体的百分比*360°
折线图
概念
用一个单位长度表示一定的数据,根据数量的多少描出各点,然后用线段顺次把各点连接起来,这样的统计图叫作折线统计图。它既可以表示出项目的具体数量,又能清楚的反映数据的变化情况
特点
易于显示数据的变化趋势
4. 分析数据
1. 集中趋势
平均数
定义
平均数是指在一组数据中所有数据之和再除以数据的个数.
数据的总和除以数据的总个数
分类
算术平均数

加权平均数
权重
在一组数据中,各个数在总结果中所占的百分数比称为这个数的权重

相同数据的个数叫做权,越大,表示的个数越多,“权”就越重。数据的权重能够反映数据的相对“重要程度”
应用
应用平均数时,所有数据都参加运算,它能充分地利用数据所提供的信息;但当一组数据中存在极大值或极小值时,平均数将不能准确表示数据的集中情况
中位数
定义
一般地,n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数
注意
一组数据的中位数是唯一的.它可以是这组数据中的数也可以是这组数据外的数
计算步骤
将这组数据按从小到大(或从大到小)的顺序排列
找到处在最中间位置的一个数或最中间的两个数的平均数即为中位数
应用
应用中位数时,计算较简单,不会受到极大值或极小值存在的影响,但不能充分利用所有数据信息
众数
定义
一般地,一组数据中出现次数最多的那个数据叫做这组数据的众数
注意
一组数据可以有不止一个众数,也可以没有众数.若几个数据出现的次数相同,并且比其他数据出现的次数都多,那么这几个数据都是这组数据的众数;当所有的数出现的次数一样多时,无众数
应用
应用众数,某些情况下,人们最关心、最重视的是出现次数最多的数据,这种情况下,应用众数简单而且能够直接满足人们的需求,但当各个数据的重复次数大致相等时,众数往往没有特别意义
2. 离散程度
极差
定义
一组数据中最大值与最小值的差
意义
极差反映了一组数据的变化范围,在一定程度上描述了这组数据的离散程度,一般来说,极差小,说明数据的波动幅度小
方差
定义
一组数据中,各个数据与它们的平均数的差的平方的平均数叫做这组数据的方差,记作s²
公式

意义
方差越大,说明这组数据的离散程度越大;方差越小,说明这组数据的离散程度越小
方差越大,数据的波动越大,越不稳定;方差越小,数据的波动越小,稳定性越好
适用情况
在平均数(中位数)相同的情况下,方差越小,则越稳定
标准差
一组数据方差的算术平方根
近似数和有效数字
近似数
利用四舍五入法取一个数的近似数时,四舍五入到哪一位,就说这个近似数精确到哪一位
有效数字
对于一个近似数,从左边第一个不是0的数字起,到精确到的位数止,所有的数字都叫做这个数的有效数字
5. 做出决策
用样本估计总体
做出判断和预测
概率
1. 确定事件与随机事件
可能性的大小
用“一定”表示必然事件
用“不可能”表示不可能事件
用“很可能、可能、不大可能”表示随机事件
确定事件
0:不可能事件
在一定条件下,一定不会发生的事件
:1:必然事件
在一定条件下,一定会发生的事件
随机事件
0~1之间:可能(随机)事件
在一定条件下,无法确定它会不会发生的事件
2. 相关概念
等可能性
一般地,设一个试验的所有可能发生的结果有n个,它们都是随机事件,每次试验有且只有其中的一个结果出现。如果每个结果出现的机会均等,那么我们说这n个事件的发生时等可能的,也称这个试验的结果具有等可能性
每次试验有且只有其中一个结果出现
出现的结果是随机的
每个结果出现的机会均等
概率
一个事件发生的可能性的大小的数值,称为这个事件的概率
3. 表示
如果用字母A表示一个事件,那么P(A)表示事件A发生的概率
必然事件A发生的概率是1,记作P(A)=1
不可能事件A发生的概率是0,记作P(A)=0
随机事件A发生的概率P(A)是0与1之间的一个数
一个随机事件发生的概率是由这个随机事件自身决定的,并且是客观存在的
概率是随机事件自身的属性,它反映这个随机事件发生的可能性大小
4. 概率模型
古典概型
一般地,如果一个试验有n个等可能的结果,当其中m个结果之一出现时,事件A发生,那么事件A发生的概率为

m:事件A发生可能出现的结果数
n:所有等可能出现的结果数
几何概型
定义
以几何图形为模型的一种概率模型,可以转化为等可能条件下的概率(古典概型)
特征
试验结果有无数个
每一次试验出现的结果具有等可能性
几何概型与面积之间的关系

5. 概率的计算方法
频率估计概率
概率的稳定性
通常,在多次重复试验中,一个随机事件发生的频率会在某一个常数附近摆动,并且趋于稳定。这个性质称为频率的稳定性
用频率估计概率
在一定条件下大量重复进行同一实验时,随机事件发生的频率会在某一个常数附近摆动。在实际生活中,人们常把这个常数作为该随机事件发生的概率的估计值
注意
概率是频率的稳定值,而频率是概率的近似值
分析预测概率
列举法
定义
在一次实验中,如果可能出现的结果只有有限个,且各种结果出现的可能性大小相等,就可以通过列举实验结果的方法,分析出随机事件发生的概率
步骤
列举出一次实验的所有可能结果
数出m,n
计算
列表法
定义
当事件中涉及两个因素,并且可能出现的结果数目较多时,用表格不重不漏地列出可能的结果,这种方法叫列表法
步骤
把所有可能发生的实验结果一一列举出来
把所求事件发生的结果都找出来
代入公式计算
树状图法
定义
当事件中涉及的有两个及两个以上的步骤时(尤其是出现了三个步骤时),用树形图的形式不重不漏地列出所有可能的结果的方法叫树形图法
步骤
把所有可能发生的结果用树状图表示出来
把所求事件发生的结果都找出来
带入公式计算