导图社区 应用统计学
应用统计学思维导图,共有九个章节,包含概念公式等,逻辑清晰,适用于期中期末复习,希望这份脑图会对你有所帮助。
编辑于2023-09-14 21:15:32 上海应用统计学
第五章 参数估计和假设检验
5.1 抽样分布
简单随机抽样和简单随机样本的性质
简单随机抽样
简单随机样本的性质
同一性
独立性
均值的抽样分布
样本算术平均数的均值
样本算术平均数的标准差
无限总体/有限放回
有限不放回
从正态分布的总体中抽样
从非正态分布的总体中抽样
中心极限定理
两个样本均值之差的抽样分布
样本比例(样本成数)的抽样分布
两个样本本例(样本成数)之差的抽样分布
样本方差的抽样分布
5.2 参数估计
参数估计的基本原理
无偏性
有效性
一致性
充分性
点估计
矩估计
极大似然估计
离散型
连续型
区间估计
总体均值的置信区间
正态总体——方差已知
正态总体——方差未知
非正态总体
n足够大,正态分布
σ²已知
σ²未知
抽样比n/N>5%,校正系数不能忽略
有限总体
两个总体均值之差的置信区间
两个正态总体——方差已知
两个方差总体——方差未知但相等
两个非正态总体
总体比例的置信区间
正态总体—方差已知
当nP和n(1-P)两者都至少等于5时,样本比例p近似服从均值为P,方差为P(1-P)/n的正态分布
两个总体比例之差的置信区间
正态分布总体方差的区间估计
两个正态总体方差之比的区间估计
样本容量的确定
给定置信度1-α的前提下,确保一定的估计精确度的样本容量计算方法
估计总体均值μ时
无限总体
有限总体不放回
估计总体成数P
无限总体
有限总体不放回
5.3 假设检验的基本原理
假设检验的基本思想
小概率原理
基本方法:反证
假设检验规则与两类错误
取伪概率的计算
假设检验的一般步骤
假设检验与置信区间的关系
5.4 几种常见的假设检验
总体均值的检验
两个总体均值之差的检验
总体比例的检验
两个总体比例之差的检验
一个正态总体方差的检验
两个正态总体方差之比的检验
5.5 方差分析
基本概念
单因素方差分析
第八章 时间数列
8.1 时间数列的种类和编制方法
定义
统计数据按时间先后顺序排列而形成的一种数列
作用
反映现象发展变化的过程和特点
研究现象发展变化的趋势和规律
对未来状态进行科学预测的重要依据
一、时间数列的种类
按数据形式不同
绝对数时间数列
时期总量指标数列
国内生产总值
时点总量指标数列
存款年末余额
相对数时间数列
平均数时间数列
按观察数据的性质和形态不同
纯随机型
确定型
二、编制时间数列的方法
时间数列的两要素
时间
与各时期对应的指标数值
注意问题
8.2 时间数列传统和分析指标
一、水平指标
发展水平
时间数列中各期指标的数值
序时平均数(平均发展水平)
序时平均数是对时间数列中各期发展水平的平均,表明现象在一段时期的一般水平。
绝对数时间数列
时期数列
时点数列
连续时点
逐日记录
间断时点
间隔相等
间隔不等
相对数时间数列和平均数时间数列的序时平均数
增长量
增长量=报告期水平-基期水平
逐期增长量
a1-a0,a2-a1,……,an-an-1
累计增长量
a1-a0,a2-a0,……,an-a0
同比增长量
=报告期某月水平-上年同月水平
平均增长量
水平法(多期增长量平稳变化)
=逐期增长量之和➗逐期增长量个数
=累计增长量➗(观察值个数-1)
总和法(各期增长变化增大)
二、速度指标
发展速度
环比发展速度
定基发展速度
同比发展速度
对于受季节因素影响比较明显的社会经济指标,为了消除季节因素影响表明他们变化的程度,可以计算同比发展速度和同比增长率
增长速度
=发展速度-1
环比增长速度
定基增长速度
同比增长速度
增长1%的绝对值
平均发展速度
环比发展速度的平均数
水平法
侧重于考察中长期计划期末发展水平
方程法
平均增长速度
=平均发展速度-1
8.3 长期趋势测定
一、时间数列的构成与分解
四种变动因素
长期趋势T
季节变动S
循环变动C
不规则变动I
时间序列的经典模型
加法模型(相互独立)
Y=T+S+C+I
乘法模型(相互交错影响)
Y=T*S*C*I
二、长期趋势(T)的测定
(一)修匀法
随手法
时距扩大法和序时平均法
时距扩大法
把时间数列中各期指标数值按较长的时距加以归并
序时扩大法
计算各段的序时平均数
移动平均法
移动项数
n为奇数
新数列项数=原数列项数-移动项数+1
n为偶数
新数列项数=原数列项数-n
(二)数学模型法
回归方程法
最小二乘法
建立坐标系的方法
直接法
t=1,2,3……
简捷法
n奇
n偶
差分法
一阶差分(逐期增长量)比较接近
直线模型
二阶差分(逐期增长量的逐期增长量)比较接近
二次曲线模型
环比发展速度比较接近
指数曲线模型
8.4 季节变动、循环变动,和剩余变动的测定
一、季节变动的测定
(一)按月(或按季)平均法
(1)先将各年同月数据按年排列
(2)计算各年同月的平均数及总平均数
(3)按各月的平均数分别除以总平均数,即得到个月的季节指数
(二)长期趋势剔除法
(1)找T
(2)
二、循环变动与不规则变动的测定
残余法
找到T,剔除
找到S,剔除
CI/C=I
8.5 时间数列预测方法
一、移动平均预测法和指数平滑法
(一)移动平均预测法
(二)指数平滑法
二、趋势外推法
三、时间数列的字相关性和自回归预测方法
(一)时间数列的自相关性
(二)自相关系数的显著性检验
(三)自回归预测法
第九章 指数
9.1 指数的概念和种类
概念
广义指数
一切说明社会经济现象现象数量变动或差异程度的相对数
狭义指数
专指说明不能直接相加的复杂社会经济现象综合变动程度的相对数
作用
反映复杂的社会经济现象总体的综合变动程度
分析社会经济现象总变动中各个因素的影响
对多指标复杂社会经济现象的综合评测
种类
按反映的对象分
个体指数
总指数
综合指数法
平均数指数法
按反应的现象性质分
按指标性质
数量指标
数值、规模
质量指标
工作质量、工作效率
按采用的基期分
环比指数
定基指数
9.2 综合指数
概念
价格指数是总指数的基本形式。它是通过引入一个同度量因素将不能相加的变量转化为可相加的总量指标,而后对比所得到的相对数。
拉氏指数
物量指数
价格固定在基期
物量指数
价格指数
派式指数
价格指数
价格固定在报告期
价格指数
物量指数
指数体系
相对数
Iqp=Iq×Ip
绝对数
Σp1q1-Σp0q0=(Σq1p0-Σq0p0)+(Σp1q1-Σp0q1)
9.3 平均数指数
变形权数
Iq
加权算数平均数指数
物量总指数
权数p0q0
Ip
加权调和平均数指数
价格总指数
权数p1q1
固定权数
Iq=∑Iqw
第四章 概率基础
第一节 概率的基本概念
随机试验和随机事件
概率的概念
概率的基本运算
概率的基本性质
加法公式
一般加法公式
互斥事件加法公式
三个推论
条件概率
统计独立
事件独立
试验独立
乘法公式
全概率公式
贝叶斯公式
第二节 随机变量及其概率分布
随机变量的概率分布
离散型
P(X=x)
有累积分布的形式,记为P(X≤x)
连续型
随机变量的期望值和方差
离散型
期望值
方差
连续型
期望值
方差
期望值和方差的数学性质
期望值
方差
第三节 常见的离散型分布
两点分布
二项分布
查表
数学期望 μ=np
方差 σ²=npq
超几何分布
放回抽样
不放回抽样
N件产品,M件次品,取n件 ,n中的次品数k
泊松分布
λ的估计
第四节 常见的连续型分布
均匀分布
期望值
方差
正态分布
概念
数学期望μ
方差σ²
正态曲线特点
性质
标准正态分布
正态分布对二项分布逼近
χ²分布
t分布
F分布
第五节 大数定律和中心极限定理
大数定律
中心极限定理
第三章 数据的描述性分析
一、绝对数和相对数
(一)绝对数
概念
绝对数(亦称总量指标)是统计资料经过汇总整理后得到的反应总体规模和水平的总和指标。
绝对数是统计资料经过汇总整理后得到的反映总体规模和水平的总和指标
水平 时点现象
规模 时期现象
作用
反映一个国家的国情国力,一个地区或企业的人力、物力、财力的基本数据
经济核算和经济活动分析的基础
计算相对数和平均数的基础
分类
1.反映总体的内容
变量总值
总水平
单位总数
总规模
2.反映的时间状态
时期数
总体在一段时间内积累的总量,指标的数值随时期长短而变化
相加后有意义 表示更长时期内的总量
时点数
总体在某一时刻的数量状态
最主要区别:是否具有可加性
3.按计量单位分
价值量
可以加总
以货币为单位
实物量
不能加总
实物计量单位
自然计量单位
度量衡制度
标准实物单位
(二)相对数
概念
相对数使用两个有联系的指标进行对比的比值,可以反映现象的数量特征和数量关系,并可将现象的绝对差异抽象化,使原本不能直接相比的绝对数可以进行比较
种类
计划完成相对数
计划数为
绝对数
相对数
平均数
结构相对数
比较相对数
强度相对数
反映企业经济效益 人口变动的相对数
有名数
动态相对数
发展速度
二、集中趋势的测定—平均数
(一)概念
平均数表明同类现象在一定时间、地点、条件下所达到的一般水平,是总体内某个变量大小各异的观察值的代表型数值,也是对变量分布集中趋势的测定
一般水平
代表性数值
变量分布集中趋势的测定
平均指标
(二)常用的几种平均数
算术平均
简单算术平均
加权算术平均
已知分母单位个数f(每组次数)
调和平均数
已知分子变量值m(每组观察值之和)
性质
各个观察值与算术平均数离差之和等于零
各个观察值与算术平均数的离差平方之和为最小值
几何平均数
简单几何平均
加权几何平均
中位数
未分组
已分组
单项式
组距
四分位数
众数
单项式
组距
概念
(三) 位置平均数与算术平均数的关系
分布对称
右偏(正偏)
左偏(负偏)
平均指标:反映总体的一般水平和分布的集中趋势
三、离散趋势的测定
概念
作用
反映变量分布离散趋势
对平均数的代表性程度的量度
是对事物发展均衡性的量度
常用的测定离散趋势的指标
异众比率
非众数组所占比重
指标越小,离散程度越小
极差(全距)
R=Xmax-Xmin或R=最大组上限-最小组下限
四分位差
(M3-M1)/2
平均差
未分组
分组
有单位
标准差
与变量X的计量单位一致
方差
未分组
已分组
离散系数
标准差系数
为什么计算标准差系数
σ是一个代有计量单位的绝对指标
若对两列数据的分布进行离散程度的比较,当它们的平均数不等、计量单位不同时,则应消除平均数不同和计量单位不可比的影响
四、数据的形态测定
偏度和峰度
偏度
为了准确地测定数据分布的偏斜程度
>0 正偏
=0 对称
<0 负偏
峰度
反映数据分布曲线顶端的尖峭或扁平程度的指标
=3 正态曲线
>3 尖顶曲线
<3 平顶曲线
第二章 统计数据的整理和展示
2.1 统计数据的整理
统计整理的意义
统计搜集到的大量资料是分散的、不系统的,只能说明各个单位的特征和属性,必须按照科学的原则加以整理,使之条理化和系统化,成为便于储存和传递的、反映总体特征的数据
统计分组
定义
所谓分组,对于定性数据就是依据属性的不同将数据划分为若干组, 对于定量数据就是依据数值的不同将数据划分成若干组
组内同质性,组间差异性
作用
在社会经济统计研究中
划分现象的类型
研究总体的结构
研究现象之间的依存关系
变量数列两要素
分组标志
频数
频数分布的编制
定性数列
定量数列
单项数列
适用于离散型变量,并且变量的取值较少
组距数列
适用于连续型变量或离散型变量且变量的取值较多的情况
确定以下三个方面的问题
确定组数
确定组距
等距数列
数据分布均匀
组距=全距/组数
异距数列
数据的分布很不均匀或是为了把现象的类型更好地划分出来
确定组限
开口组
无法确定实际数据的取值范围,或者数据中存在极端数值,即存在着个别特别大或特别小的数值
确定组中值
(上限+下限)/2
开口组组中值:以相邻一组的组距为准
意义
当数据整理成分组数据,原来各组具体观察数据已看不见。假定各组是均匀分布或对称分布,则可以用组中值作为各组的平均水平(代表值),能够计算出总体指标, 而实际上,各组分布不可能是均匀分布,因此计算得到的总体指标是一个近似值。
2.2 统计数据的图表展示
统计表
按作用分
调查表
汇总整理表
计算分析表
按数据所属时间分
时间序列表
截面数据表
按分组变量的多少
单变量分组表
多变量分组表
平行形式
交叉形式
统计图
饼图
条形图
直方图
等距数列
异距数列
频数密度=某组的的频数/该组的组距
折线图
曲线图
枝叶图
第一章 统计和统计数据的搜集
统计
统计的三层含义
统计工作
统计数据
统计学
四个术语
总体
样本
参数
统计量
统计学的内容
描述统计
搜集展示一批数据,并反映这批数据的各种方法,是为了正确地反映总体的数量特征
推断统计
用样本统计量推断总体参数的技术和方法
数据
数据分类的原则
数据的类型
定性数据和定量数据
离散型数据和连续型数据
数据的四个层次
定类数据
只对事物的某种属性和类别进行具体的定性描述
计数
产业分类
定序数据
对事物所属的属性顺序进行描述
排序
企业等级
定距数据
比定序数据的描述功能更好的定量数据
加减 有基本测量单位
温度
定比数据
比定距数据更高一级的定量数据
乘除 有基本测量单位 有绝对零点
商品销售额
截面数据和时间序列数据
原始数据和次级数据
数据的来源
调查方案的主要内容
确定调查的目的
确定调查对象和调查单位
拟定调查提纲
确定调查时间
编制调查的组织计划
搜集数据的组织方式
普查、抽样调查、统计报表制度、重点调查
普查
工作量大、时间性强
国力国情和资源状况
抽样调查
抽样误差可以实现计算并加以控制
统计报表制度
自上而下统一布置 自下而上提供资源
重点调查
个别或部分重点单位
抽样的类型
非随机抽样
判断抽样
定额抽样
方便抽样
随机抽样
简单随机抽样
系统抽样
分层抽样
整群抽样
相对数分析要与绝对数分析相结合
相对数抽象了现象数量的绝对差异,只说明现象数量相对差异。因此,如果对比的基数不同,同样的相对数其绝对差额却可能很悬殊。
序时平均数与平均指标有何异同?
均是反映现象的一般水平
序:反映在一段时间的一般水平
序:动态平均
序:由时间数列计算
平:由变量数列计算
平:静态平均
平:反映在同质总体的一般水平
编制综合指数如何确定同度量因素?
数量指标 Iq
同度量固定在基期
质量指标Ip
同度量固定在报告期
综合指数与平均数指数有何区别?
联系
平均数指数和综合指数都是编制总指数的方法
在一定权数下有变型关系
区别
资料来源不同
综合:全面资料
平均:抽样资料
计算方法不同
综合:先综合再对比
平均:先对比再综合
分子分母之差所表达的含义不完全相同
综合:具有一定的经济内容,即说明由于价格变动或物价变动部分带来的价值总量指标的增减量
平均:不完全具有价值总量指标增减的经济内容
变形权数:有意义
固定权数:无意义
为何将平均指标与标志变异指标结合运用?
平均指标用来反映总体的集中趋势,变异指标用来反映总体的离散趋势, 而各个变量值在平均值周围摆动,呈现出一种离中趋势。 所以要完整地反映整个数据的分布状态,既要考察集中趋势,也要考察离散趋势,所以将平均指标与离散指标在结合起来。
如何区分平均指标与强度相对指标
平均指标=变量总值/单位个数 强度相对指标=某一变量值/另一不同变量值
前者分子、分母属于同一总体
前者分子依附于分母
前者分子、分母不可交换
算术平均与几何平均、调和平均的使用条件
算术平均:变量值之和等于总值。适用于数值型数据,不适用于品质数据
几何平均:变量值之积等于总值。适用于总水平、总成果等于所有阶段、所有环节水平、成果的连乘积时,常用于发展速度、比率等变量的平均
调和平均:已知分子变量值
算术平均:已知分母单位个数
集中趋势和离散趋势各有什么作用