导图社区 统计学第一章笔记
本导图汇总了统计学第一章的知识点,包括统计的含义与本质、统计学的发展、学科性质与作用、统计数据的含义、计量尺度、统计的研究过程与方法等。
编辑于2021-11-14 15:24:49第一章 总论
1、统计的含义与本质
统计的本质就是用数据说明问题,用数据反映真相
三种含义:统计活动、统计数据、统计学
统计活动:对各种统计数据进行收集、整理并做出相应的推断、分析的活动(分为:统计调查、统计整理、统计分析)
统计数据:通过统计活动获得的,用以表现研究现象特征的各种形式的数据
统计学:指导统计活动的理论和方法,是关于如何收集、整理和分析统计数据的科学
三种含义以统计数据为核心
2、统计学的发展
三个阶段:古典统计学时期、近代统计学时期、现代统计学时期
古典:17ct中-18ct中,认为统计学起源于两大学派:国势学派和政治算术学派。
国势学派:关于国家显著事项的学问。德国的康令和阿亨瓦尔。有统计学之名无统计学之实
政治算术学派:主张以数字、重量和尺度来研究社会经济现象及其关系,英国的威廉·配第《政治算术》、约翰·格朗特《关于死亡表的自然和政治观察》。无统计学之名有统计学之实
近代:18ct末-19ct末。大数法则和概率论。
数理统计学派:比利时的凯特勒《概率论书简》
社会统计学派:德国的克尼斯
现代统计学:19ct末到现在。统计学发展最辉煌的时期。
3、学科性质与作用
学科性质
就其研究对象而言:数量性、总体性、差异性
就其学科范畴而言:方法性、层次性、通用性
就其研究方式而言:描述性、推断性
推断:根据样本观测结果对总体数量特征做出估计或进行假设检验,对不确定事物做出定量的推断。
描述:运用各种方法对研究现象进行观察调查,获取数据,然后进行汇总、分类和计算,并用表格、图形和综合指标的方式来加以显示。
作用
为我们认识自然和社会提供了必需的方法和途径
在指导生产生活过程中发挥重要作用
在社会经济管理活动中发挥重要作用
为科学研究提供有力手段
4、数据、统计数据的含义,统计数据的类型、特征,计量尺度,统计的研究过程与方法
数据:狭义数据:可进行数学运算的数值,即结构化数据;除了数值外的非结构化数据。其基本特征为:可记录、存在的事实、具有最适当的表现形式、具有意义
统计数据:能通过统计方法加以处理和分析的数据
统计数据的类型
根据采用的计量尺度不同,分为定性数据和定量数据
定性数据:事物品质特征或属性特征只能用文字或数字代码表示的
定类数据:对事物进行分类的结果,表现为类别。如男女;1、0表示男和女等,此时的数字没有大小之别,只是符号而已
定序数据:对事物按照一定的排序进行分类,有顺序的类别。如优良好中差;用54321表示优良好中差等,数字代码能体现一种顺序或程度的不同
定量数据:用数值表现事物数量特征
定距数据
不仅能反映事物所属的类别和顺序,还能反映事物类别和顺序之间的数量差距。如85分和55分。只适合与进行加减计算。不存在绝对零点,可以有0的存在。
定比数据
不仅能体现事物之间的数量差距,还能通过对比运算,即计算两个测度值之间的比值来体现相对程度的数据。只要反映存在绝对零点(零就是没有)的数据都是定比数据
定比数据包含信息>定距数据>定序数据>定类数据
表现形式不同,分为绝对数、相对数、平均数
绝对数:反映绝对数量特征,有明确的计量单位。是表现直接数量标志或总量指标的形式
相对数:相对数量特征,主要表现为没有明确的计量单位的无名数
结构相对数,如某地区三大产业比重为12%、48%、40%
比例相对数,如107:100
比较相对数,如A是B的2倍
动态相对数,发展速度为109%
强度相对数,人口出生率为10.9%
计划完成程度相对数
平均数,平均数量特征,表现现象某一方面的一般数量水平
来源不同,分为观测数据、实验数据、大数据
观测数据,用统计调查或观测的方式获得,在没有人为控制的条件下获得
实验数据,在人为控制下,通过实验的方式获得
大数据,基于现代信息技术而产生的数字化信息,“体量巨大,形式多样,快速增加和蕴含信息价值”
加工程度不同,分为原始数据和次级数据
原始数据,直接向调查对象收集的、尚待加工整理、只反映个体特征;原始记录数据
次级数据,加工数据,二手、三手、更多手数据,已经加工整理、能反映总体数量特征的非原始数据
时间和空间状态不同,分为时序数据和截面数据
时序数据:同一现象在不同时间上收集的数据(空间相同,时间不同)
截面数据,同类现象在相同或相近时间上收集的数据(空间状态相同,时间状态不同)
两者结合,成为平行数据
统计数据的研究过程
四个环节:统计设计、数据收集、数据整理、数据分析与解释
统计数据的研究方法
5个方法
大量观察法:基本方法,基于大数定律
统计分组法:传统分组、判别分组、聚类分组
综合指标法(是描述统计学的核心内容):总量指标、相对指标、平均指标
统计推断法:用样本来推断总体,存在误差和置信度
统计模型法:运用数学模型。三个基本要素:变量、数学方程、模型参数
5、总体、个体、样本、标志、变量、指标、指标体系
总体:统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体,也称为母体。每个个别事物称为个体,也称为总体单位。具有大量性(条件)、同质性(基础)、差异性(前提)
总体分类:4种
个体数量是否有限:有限总体和无限总体
有限总体:总体容量是有限的。
无限总体:总体容量是无限的
存在形态不同可以划分为具体总体和抽象总体
具体总体:现实存在的各个具体事物所组成的总体
抽象总体即设想总体,由想象中存在的各个假定事物组成的总体,是具体总体的延伸和抽象化
个体能否可以计数分为可计数总体和不可计数总体
可计数总体:能对其所包括的个体进行计数且计数结果能加总。所包括的个体具有相同的计量单位
不可计数总体:所包括的个体不能计数或计数结果不能加总。个体通常不具有相同的计量单位,不能计算总体单位总数
个体是否人为划分,分为自然总体和人为总体
自然总体:由自然确定的个体组成的总体,个体是明确的、易定的
人为总体:人为确定的个体组成的总体,个体往往不明显或难以确定
样本
含义:从总体中抽取的一部分个体组成的集合,也称为子样。样本中包含的个体数,称为样本容量或样本单位数
样本的大小:0<X<1
不具有唯一性,除非样本就是总体本身
标志
含义:用以描述或体现个体特征的名称。标志在每个个体上的具体结果称为标志表现
分类
结果的表示方式不同,分为品质标志和数量标志
品质标志:只能用文字表示,不能用数值表示,表现为定性数据
数量标志:结果用数值表示,表现为定量数据
在每个个体上的表现结果是否相同分为不变标志和可变标志
不变标志:在每个个体上的具体表现完全相同。是相关个体集合成总体的基础,总体的同质性也正体现在要求至少具有一个不变标志
可变标志:在每个个体上的具体表现不相同,也称为变异。总体的差异性也体现至少要有一个可变标志
表现个体特征的直接程度不同分为直接标志和间接标志
直接标志:直接表明个体的属性特征或数量特征。一般品质标志是直接标志
间接标志:通过两个或两个以上数量标志计算后(通常是对比)间接表明个体数量特征的标志。间接标志是数量标志
变量
含义:狭义:是可变的数量标志,是可变数量标志的抽象化;广义上看,不仅是可变的数量标志,也包括可变的品质标志
分类
反映数据的计量尺度不同,分为定性变量和定量变量
定性变量:反映定性数据的变量,包括定类数据的定类变量和反映定序数据的定序变量
定量变量:反映定量数据的变量,包括定距数据的定距变量和反映定比数据的定比变量
受影响程度不同,分为确定性变量和不确定性变量
确定性变量:受确定性因素影响,变量的变化方向和变动程度是可确定的
不确定变量:受随机因素影响的变量,变量受随机因素影响的大小和方向是不确定的。
数值的变化是否连续,分为离散型变量和连续性变量
离散型变量:只能取整数值的变量,变量的变化是不连续的、间断的
连续性变量:可以在一定区间内去任意实数值的变量,变量的变化是连续的、不间断的。要采用测量或计算的方法来取得其数值
统计指标简称指标
含义:是反映现象总体数量特征的概念及其数值
组成:由指标名称和指标数值组成
六要素:指标名称、计算方法、空间限制、时间限制、具体数值、计量单位
三特点:数量性、综合性和具体性
分类
计算范围不同,分为总体指标和样本指标
总体指标:反映总体数量特征,也称为总体参数
样本指标:仅仅根据总体中部分个体的标志表现综合计算而得,反映样本数量特征,也称为样本统计量
反映现象内容的不同,分为数量指标和质量指标
数量指标:也称为总量指标,反映总体某一方面绝对数量特征的指标,表明现象所达到的规模、总水平或工作总量。计量单位有实物单位(自然单位、度量衡单位、双重单位、复合单位)、价值单位、时间单位
总体标志总量和总体容量
时期指标:反映现象在一定时期内累计达到的总量,其数值大小和时间长短有关系
时点指标:反映现象在某一时点所达到的总量,数值大小与时间长短无直接关系,不需要连续登记
质量指标:反映现象总体内在对比关系或总体间对比关系的指标,表明现象所达到的相对水平、平均水平、工作质量或相互依存关系
相对指标:事物内部或相关事物之间相对数量关系的指标,两个有联系的统计指标对比的结果
平均指标:反映变量分布集中趋势或中心位置的指标,表明变量的一般数量水平
反映现象的时间状态不同,分为静态指标和动态指标
静态指标:现象总体在某一时点或相对静止时间上数量特征的指标
动态指标:现象总体在不同时期或时点上发展变化情况的指标
指标体系:一系列指标所形成的体系
表现形式:1、数学等式关系 2、相互补充关系 3、相关关系 4、原因、条件和结果关系
设计原则:目的性、科学性、可行性、灵活性、层次性、联系性、协调性
定类尺度和定序尺度只能计量离散型变量;定距尺度和定比尺度既可以用来计量离散型变量又可以用来计量连续性变量
总体单位与统计标志
总体单位(个体)是标志的承担者,是载体
标志是依附于个体并说明个体的属性和特征
个体与总体的关系
总体容量随个体个数的增减可变大变小
随着研究目的的不同,总体中的个体可发生变化
随着研究范围的变化,总体与个体的角色可以变换
总体与个体要根据研究目的和对象范围而定