导图社区 《统计学》第1章、导论
贾俊平《统计学》导论部分,统计学是收集、处理、分析、解释数据并从数据中得到结论的科学,本图适用于基础薄弱的同学,后续还会更新。
编辑于2023-09-18 21:48:08 甘肃导论
什么是统计学
统计学的概念
综合来说,统计学是收集、处理、分析、解释数据并从数据中得到结论的科学
统计学是关于数据的科学
它所研究的是来自各领域的数据。
它所提供的是一套有关数据收集、处理、分析、解释并从中得到结论的方法
数据收集
取得统计数据
数据处理
将数据用图表等形式展示出来
数据分析
选择适当的统计方法研究数据
并从数据中提取有用信息进而得到相关结论
统计学的基本任务
概念
统计学的基本任务,是对经济社会发展
进行统计调查、统计分析
提供统计资料和统计咨询意见
实行统计监督
统计的基本任务=统计的三大职能
内容包括
信息职能
统计最基本的职能,是保证咨询和监督职能得以有效发挥的前提
咨询职能
监督职能
是信息职能的拓展和深化,是在充分发挥信息职能的基础上,对统计整体效能的提高。
关系
相互作用、相互促进、相辅相成和密切联系的
统计分析所用的方法
描述性统计
概念
描述性统计,研究的是数据收集、处理、图表展示、汇总、概括性度量等统计方法
内容
包括
如何取得研究所需要的数据
如何用图表形式对数据进行处理与展示
如何通过对数据的汇总、概括、分析,得到所关心的数据特征。
目的
是描述数据特征以及找到数据的基本规律。
推断性统计
概念
推断统计,研究的是如何利用样本数据来推断总体特征的统计方法
内容
主要包括
参数估计
参数估计是利用样本信息推断所关心的总体特征;
假设检验
假设检验是利用样本信息判断对总体的某个假设是否成立。
目的
对总体特征做出判断。
例子
对产品的质量进行检验,往往是破坏性的,不可能对每个产品进行测量。这就需要抽取部分个体即样本进行测量,然后根据获得的样本数据对所研究的总体特征进行推断,这就是推断统计要解决的问题
统计学的应用领域
统计数据的类型
所采用计量尺度不同
数据的测量/计量尺度的种类
分类尺度
概念
按照事物的某种属性对其进行的平行的分类
数据表现为
类别
对应分类数据
对应分类变量
顺序尺度
概念
对事物类别顺序的测度
数据表现为
有序的类别
对应顺序数据
对应顺序变量
间隔尺度
概念
对事物类别或次序之间间距的测度,没有绝对零点
数据表现为
数字
对应数值型数据
对应数值型变量
比率尺度
概念
对事物类别或次序之间间距的测度,有绝对零点
数据表现为
数字
对应数值型数据
对应数值型变量
数据分类
分类数据
对应尺度
分类尺度/定类尺度/名义尺度
概念
分类数据,是只能归于某一类别的非数字型数据
是对事物进行分类的结果,数据表现为类别,是用文字来表述的
表示方法
为了便于统计,对于分类数据,可以用数字代码来表示各个类别
例子
人口按照性别分为男、女
用1表示“男性”,用0表示“女性”
企业按行业分为医药企业、家电企业、纺织企业等
用1表示“医药企业”,用2表示“家电企业”,用3表示“纺织企业”等
顺序数据
对应尺度
顺序尺度
概念
顺序数据,是只能归于某一有序数据类别的非数字型数据
虽然也是类别,但这些类别是有序的
表示方法
顺序数据也可以用数字代码来表示
例子
一等品、二等品、三等品……
成绩:优、良、中、及格、不及格
非常同意、同意、保持中立、不同意、非常不同意
1—非常同意;2—同意;3—保持中立;4—不同意;5—非常不同意
数值型数据
对应尺度
间隔尺度(没有绝对零点)
比率尺度/定比尺度(有绝对零点)
概念
按数字尺度测量的观察值
表现为具体的数值
例子
现实中所处理的大多数是数值型数据
总结
分类数据和顺序数据
说明的是事物的品质特征,通常使用文字来表述,结果表现为类别
因此又被称作定性数据过品质数据
数值型数据
说明的是现象的数量特征,通常是用数值来表现
因此又称为定量数据、数量数据
统计数据的收集方法不同
观测数据
概念
通过调查过观测收集到的数据
特点
这类数据是在没有对事物人为控制的条件下得到的
例子
有关社会经济现象的统计数据几乎都是观测数据
实验数据
概念
是在实验中控制实验对象而收集到的数据
例子
自然科学领域的大多数数据为实验数据
一种新药疗效的实验数据
一种新农作物品种的实验数据
被描述现象与时间的关系不同
截面数据
概念
是在相同或相近的时间点上收集的数据
特点
这类数据通常在不同的空间获得
用途
用于表述现象在某一时刻的变化情况
例子
2020年我国各省份国内生产总值
时间序列数据
概念
在不同时间收集到的数据
特点
这类数据是按时间顺序收集到的
用途
用于描述现象随时间变化的情况
例子
2018-2022年我国国内生产总值
面板数据
统计学的几个基本概念
总体与样本
总体与个体
总体
概念
总体,是根据一定目的和要求所确定的研究事物的全体
是包含所研究全部个体(数据)的集合
构成
通常是由所研究的一些个体组成
这些个体客观存在,且具有某种/某些共同性质
特征
同质性
总体单位都必须具有某一共同的品质标志属性或数量标志数值,它是构成总体的条件。
大量性
构成总体的单位数目要足够多
差异性
总体单位必须具有一个或若干个品质变异标志或数量变异标志。
类型
根据所包含的单位数目是否可数
有限总体
概念
总体的范围能够明确确定,而且元素是有限可数的
例如
一堆灯泡
无限总体
概念
总体所包含的元素是无限的、不可数的
个体
概念
个体,是构成总体的每个元素
是各项统计数字最原始的承担者。
总体与个体的关系
总体和个体是相对的
在一次特定范围、目的的统计研究中
统计总体与总体单位是不容混淆的
二者的含义是确切的,是包含与被包含的关系。
总体和个体是可以相互转化的
随着统计研究目的及范围的变化
统计总体和总体单位可以相互转化
同一事物在不同情况下,可以作为总体,也可以作为个体。
样本
样本
概念
从总体中抽取的一部分元素的集合
样本量/样本容量
概念
构成样本的元素的数目
例子
要检验一批灯泡的使用寿命,从这批灯泡中随机抽取50个
总体
这一批灯泡
个体
每个灯泡
样本
这50个灯泡(的使用寿命数据)
样本量/样本容量
50
参数与统计量
参数
总体参数
概念
参数,是用来描述总体特征的概括性数字度量
是研究人员想要了解的总体的某项特征值,是对总体特征的数量描述
特点
是一个确定的常量,到一般情况下未知
常用参数
总体平均数、总体方差/标准差、总体比例
统计量
样本统计量
概念
是用来描述样本特征的概括性数字度量
特点
一般已知
是根本样本数据计算出来的一个量
本质
由于样本是随机的
因此统计量本质上是样本的函数
常用统计量
样本平均值、样本方差/标准差、样本比例
变量与变量值
变量
概念
是说明现象某种特征的概念
特点
从一次观察到下一次观察,结果会呈现出差别或变化。
类别
所采用的计量尺度不同
分类变量
概念
是说明事物类别的一个名称
其取值是分类数据
又称:品质标志
例如
性别
男
女
行业
零售业
服务业等
顺序变量
概念
说明事物有序类别的一个名称
其取值是顺序数据
例如
受教育程度
小学、初中、高中……
对某事物的喜爱程度
非常讨厌、讨厌、中立、喜欢、……
数值型变量
概念
说明事物数字特征的一个名称
取值是数值型数据。
分类
离散型变量
概念
只能取可数值的变量
取值特点
只能取有限个值,而且其取值都以整位数
例如
企业个数、职工人数、设备台数
连续型变量
概念
在一定区间内可以任意取值的变量
取值特点
数值是连续不断的,不能一一举例
相邻两个数值可作无限分割,即可取无限个数值
例如
年龄、温度、生产零件的规格尺寸、人体测量的身高、体重、胸围等等
其他角度
随机变量、非随机变量
经验变量、理论变量
变量值
变量的具体取值
导论
什么是统计学
统计学的概念
综合来说,统计学是收集、处理、分析、解释数据并从数据中得到结论的科学
统计学是关于数据的科学
它所研究的是来自各领域的数据。
它所提供的是一套有关数据收集、处理、分析、解释并从中得到结论的方法
数据收集
取得统计数据
数据处理
将数据用图表等形式展示出来
数据分析
选择适当的统计方法研究数据
并从数据中提取有用信息进而得到相关结论
统计学的基本任务
概念
统计学的基本任务,是对经济社会发展
进行统计调查、统计分析
提供统计资料和统计咨询意见
实行统计监督
统计的基本任务=统计的三大职能
内容包括
信息职能
统计最基本的职能,是保证咨询和监督职能得以有效发挥的前提
咨询职能
监督职能
是信息职能的拓展和深化,是在充分发挥信息职能的基础上,对统计整体效能的提高。
关系
相互作用、相互促进、相辅相成和密切联系的
统计分析所用的方法
描述性统计
概念
描述性统计,研究的是数据收集、处理、图表展示、汇总、概括性度量等统计方法
内容
包括
如何取得研究所需要的数据
如何用图表形式对数据进行处理与展示
如何通过对数据的汇总、概括、分析,得到所关心的数据特征。
目的
是描述数据特征以及找到数据的基本规律。
推断性统计
概念
推断统计,研究的是如何利用样本数据来推断总体特征的统计方法
内容
主要包括
参数估计
参数估计是利用样本信息推断所关心的总体特征;
假设检验
假设检验是利用样本信息判断对总体的某个假设是否成立。
目的
对总体特征做出判断。
例子
对产品的质量进行检验,往往是破坏性的,不可能对每个产品进行测量。这就需要抽取部分个体即样本进行测量,然后根据获得的样本数据对所研究的总体特征进行推断,这就是推断统计要解决的问题
统计学的应用领域
统计数据的类型
所采用计量尺度不同
数据的测量/计量尺度的种类
分类尺度
概念
按照事物的某种属性对其进行的平行的分类
数据表现为
类别
对应分类数据
对应分类变量
顺序尺度
概念
对事物类别顺序的测度
数据表现为
有序的类别
对应顺序数据
对应顺序变量
间隔尺度
概念
对事物类别或次序之间间距的测度,没有绝对零点
数据表现为
数字
对应数值型数据
对应数值型变量
比率尺度
概念
对事物类别或次序之间间距的测度,有绝对零点
数据表现为
数字
对应数值型数据
对应数值型变量
数据分类
分类数据
对应尺度
分类尺度/定类尺度/名义尺度
概念
分类数据,是只能归于某一类别的非数字型数据
是对事物进行分类的结果,数据表现为类别,是用文字来表述的
表示方法
为了便于统计,对于分类数据,可以用数字代码来表示各个类别
例子
人口按照性别分为男、女
用1表示“男性”,用0表示“女性”
企业按行业分为医药企业、家电企业、纺织企业等
用1表示“医药企业”,用2表示“家电企业”,用3表示“纺织企业”等
顺序数据
对应尺度
顺序尺度
概念
顺序数据,是只能归于某一有序数据类别的非数字型数据
虽然也是类别,但这些类别是有序的
表示方法
顺序数据也可以用数字代码来表示
例子
一等品、二等品、三等品……
成绩:优、良、中、及格、不及格
非常同意、同意、保持中立、不同意、非常不同意
1—非常同意;2—同意;3—保持中立;4—不同意;5—非常不同意
数值型数据
对应尺度
间隔尺度(没有绝对零点)
比率尺度/定比尺度(有绝对零点)
概念
按数字尺度测量的观察值
表现为具体的数值
例子
现实中所处理的大多数是数值型数据
总结
分类数据和顺序数据
说明的是事物的品质特征,通常使用文字来表述,结果表现为类别
因此又被称作定性数据过品质数据
数值型数据
说明的是现象的数量特征,通常是用数值来表现
因此又称为定量数据、数量数据
统计数据的收集方法不同
观测数据
概念
通过调查过观测收集到的数据
特点
这类数据是在没有对事物人为控制的条件下得到的
例子
有关社会经济现象的统计数据几乎都是观测数据
实验数据
概念
是在实验中控制实验对象而收集到的数据
例子
自然科学领域的大多数数据为实验数据
一种新药疗效的实验数据
一种新农作物品种的实验数据
被描述现象与时间的关系不同
截面数据
概念
是在相同或相近的时间点上收集的数据
特点
这类数据通常在不同的空间获得
用途
用于表述现象在某一时刻的变化情况
例子
2020年我国各省份国内生产总值
时间序列数据
概念
在不同时间收集到的数据
特点
这类数据是按时间顺序收集到的
用途
用于描述现象随时间变化的情况
例子
2018-2022年我国国内生产总值
面板数据
统计学的几个基本概念
总体与样本
总体与个体
总体
概念
总体,是根据一定目的和要求所确定的研究事物的全体
是包含所研究全部个体(数据)的集合
构成
通常是由所研究的一些个体组成
这些个体客观存在,且具有某种/某些共同性质
特征
同质性
总体单位都必须具有某一共同的品质标志属性或数量标志数值,它是构成总体的条件。
大量性
构成总体的单位数目要足够多
差异性
总体单位必须具有一个或若干个品质变异标志或数量变异标志。
类型
根据所包含的单位数目是否可数
有限总体
概念
总体的范围能够明确确定,而且元素是有限可数的
例如
一堆灯泡
无限总体
概念
总体所包含的元素是无限的、不可数的
个体
概念
个体,是构成总体的每个元素
是各项统计数字最原始的承担者。
总体与个体的关系
总体和个体是相对的
在一次特定范围、目的的统计研究中
统计总体与总体单位是不容混淆的
二者的含义是确切的,是包含与被包含的关系。
总体和个体是可以相互转化的
随着统计研究目的及范围的变化
统计总体和总体单位可以相互转化
同一事物在不同情况下,可以作为总体,也可以作为个体。
样本
样本
概念
从总体中抽取的一部分元素的集合
样本量/样本容量
概念
构成样本的元素的数目
例子
要检验一批灯泡的使用寿命,从这批灯泡中随机抽取50个
总体
这一批灯泡
个体
每个灯泡
样本
这50个灯泡(的使用寿命数据)
样本量/样本容量
50
参数与统计量
参数
总体参数
概念
参数,是用来描述总体特征的概括性数字度量
是研究人员想要了解的总体的某项特征值,是对总体特征的数量描述
特点
是一个确定的常量,到一般情况下未知
常用参数
总体平均数、总体方差/标准差、总体比例
统计量
样本统计量
概念
是用来描述样本特征的概括性数字度量
特点
一般已知
是根本样本数据计算出来的一个量
本质
由于样本是随机的
因此统计量本质上是样本的函数
常用统计量
样本平均值、样本方差/标准差、样本比例
变量与变量值
变量
概念
是说明现象某种特征的概念
特点
从一次观察到下一次观察,结果会呈现出差别或变化。
类别
所采用的计量尺度不同
分类变量
概念
是说明事物类别的一个名称
其取值是分类数据
又称:品质标志
例如
性别
男
女
行业
零售业
服务业等
顺序变量
概念
说明事物有序类别的一个名称
其取值是顺序数据
例如
受教育程度
小学、初中、高中……
对某事物的喜爱程度
非常讨厌、讨厌、中立、喜欢、……
数值型变量
概念
说明事物数字特征的一个名称
取值是数值型数据。
分类
离散型变量
概念
只能取可数值的变量
取值特点
只能取有限个值,而且其取值都以整位数
例如
企业个数、职工人数、设备台数
连续型变量
概念
在一定区间内可以任意取值的变量
取值特点
数值是连续不断的,不能一一举例
相邻两个数值可作无限分割,即可取无限个数值
例如
年龄、温度、生产零件的规格尺寸、人体测量的身高、体重、胸围等等
其他角度
随机变量、非随机变量
经验变量、理论变量
变量值
变量的具体取值