导图社区 统计学
统计学期末复习知识点整理,从统计数据的收集、整理与显示;综合指标与数据分布特征;时间数列等方面进行了分析。
编辑于2021-08-31 18:56:52统计学
导论
什么是统计
定义:是人们认识客观世界总体数量变动关系和变动规律的活动的总称
三种含义
(1)统计工作(计实践或统计活动):指统计资料的搜集活动。
(2)统计数据(统计资料):指统计工作的结果,统计所提供的数字数据和其他文字、图表数据等。
(3)统计学:研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。
研究对象特点
(1)数量性
(2)总体性
(3)变异性
基本环节
统计设计
收集数据
实验法:自然\实验数据
调查法:调查数据
整理与分析
描述统计:用数值、表格或图形表示出的有用信息。
推断统计:用样本去推断(概率抽样)/估计(非概率抽样)总体
统计学学派
1.政治算术学派
有统计之实,无统计之名
威廉·配第&约翰格朗特
2.国势学派
有统计之名,无统计之实
康令&阿亨瓦尔
3.社会统计学派 应用
4.数理统计学派 理论 阿道夫凯特勒
统计学基本概念
总体&总体单位
含义:所要研究的事物的全体,由客观存在的、具有某种共同性质的许多个别事物构成的整体。
特点:大量性;同质性;差异性
总体单位:组成总体的各个个体,是各项统计数量特征的承担者。
样本(子样)
样本容量:一个样本里有多少
样本个数:多少个样本
样本:从总体中抽取的部分单位
标志与指标
标志
含义:说明总体单位属性和数量特征的名称。名称为标志,数值为标志值
品质标志:标明单位的属性或性质特征。eg:每个工人的性别。
数量标志:标明单位的数量特征。eg:每个工人的年龄。
不变标志:一个总体中各单位有关标志的具体表现都相同。eg:在工人这一总体中,职业是不变标志。
变异标志:总体中各单位的具体表现不同。eg:各人的工龄可能表现不同
指标
定义:反映总体的数量特征的概念和数值。包括指标名称和指标数值两部分。如居民人口数100万人,总收入314亿元。
数量指标:反映总规模水平或工作总量,如人口总数、社会总产值等。用绝对数表示。
质量指标:反映相对水平或工作质量、现象之间的内在联系和对比关系。如平均亩产、平均工资、工人出勤率、单耗等。用相对数或平均数表示。
统计指标体系:由一系列相互联系的统计指标所组成的有机整体、如,企业意争力指标体系、居民生活质量指标体系。
参数与统计量
含义:总体分布的数量特征,是确定、未知的
认识/推断总体 统计量
是样本的一个函数
是随机变量,其取值随着抽取的样本单位不同而变化。
统计数据
变量&变量值:说明现象的某一数量特征的概念;变量的具体取值为变量值,统计数据就是统计变量的具体表现。
计量尺度:由低到高、由粗略到精确划分
定性数据
①名义级数据:=≠ eg:居民的性别是男女
②序次级数据:=≠<>eg:文化程度 产品等级 满意度
定量数据
③间距级数据:=≠<>+-无绝对零点 eg:气温 0℃依旧存在
④比率级数据:=≠<>+-x÷绝对零点 eg: 身高 0cm不存在
数据类型
①横截面数据(静态数据):在同时间对同总体内不同单位的数量进行观察
②时间序列数据(动态数据):在不同时间对同总体的数量表现进行观察
③面板数据则是同时在截面和时间空间上取得的二维数据
表现形式
绝对数
相对数
平均数
统计数据的收集、整理与显示
统计数据的收集
统计调查方案
why、who、what、when、how
统计调查的组织形式
按调查对象所包括的范围
全面调查
普查、全面统计报告
非全面调查
抽样调查、重点调查和典型调查
按搜集资料的方法
询问法、观察法
按调查登记是否连续
经常性调查(间隔<1年)
一次性调查(间隔>1年)
按调查的组织形式
统计报表制度(自上而下布置任务,自下而上上报调查资料)
专门调查
普查、重点调查、抽样调查、典型调查
统计误差
登记性误差(任何一种调查)
代表性误差(非全面调查特有)
抽样误差(随机误差),无法避免但可计算和控制,随机抽样导致)
系统性误差,可以避免,非随机抽样调查导致
统计数据的整理
意义
根据统计研究的需要,将收集到的大量反映个体特征的数据进行科学的分类汇总、加工处理,或对收集到的次级资料进行加工,使之系统化,条理化,成为反映总体特征的综合资料
统计分组(分总体合个体)
作用
划分总体的类型
反映现象内部结构和比例关系
揭示现象之间的相互依存关系
原则
穷尽原则(任何一个个体都归属某一个组)
互斥原则(任何一个个体仅归属某一个组)
种类
按分组标志的性质
品质标志分组
数量标志分组
按分组标志的多少
简单分组
复合分组
分配数列
概念
将总体各单位按某个标志分成若干组,列出各组的总体单位数或各组单位数在总体单位数中所占的比重
种类
品质数列(按品质标志分组)
变量数列(按数量标志分组)
单项式变量数列
一个变量值代表一组
适用于变异范围较小的离散变量
组距式变量数列
间断组距式分组、连续组距式分组(上限不在内)
等距分组、异距分组
组中值(上限+下限)/2
适用所有连续变量和变异范围大的离散变量
编制
确定分组的形式
确定组数
确定组距
计算各组组次
次数分布
钟型分布
“中间大,两头小”包括对称分布和偏态分布
U型分布
“中间小,两头大”又称倒钟型分布
J型分布
“一头大,一头小”包括正J型分布和倒J型分布
累计次数分布
向上累计(由变量小的组向变量大的组累加各组的次数或频率,直到该组的上限)
向下累计(由变量大的组向变量小的组累加各组的次数或频率,直到该组的下限)
统计数据的图表显示
统计表
选择合适的总标题(时间、空间、总体、指标)
合理安排统计表的结构(表中行列各栏一般按先局部后总体的原则排列)
若统计表栏数较多,加以编号
数字保持同一精确度、整齐,注明单位,不写“同上”,无数字时用“—”表示
必要时加注说明或注释
统计图
直方图
展示组距数列分布特征,适合描述定量数据分布
折线图
两个终点与横轴相交,所围成面积与直方图相同
茎叶图
类似于直方图,与直方图比较,其构造更容易且能显示变量的实际值;展示总体数据的主要分布特征,但掩盖了组内数据的主要差异
柱形图
既可以用来表示定性数据的分布,也可以进行同类现象在不同空间、时间的对比
饼图
表示各部分对于总体的比例,适合描述定性变量结构状况
曲线图
理论曲线,用来描述各种统计量和分布规律
帕拉图
类似于直方图,定性变量的次数分布条形图
散点图
用来分析两个变量之间的相关关系
综合指标与数据分布特征
总量指标
定义
又称绝对数或绝对指标,反映社会经济现象总体在一定时间,空间条件下的总规模总水平的综合指标
种类
反映内容
总体单位总量
总体单位数的加总(总体单位总个数)
总体标志总量
总体各单位标志值的加总
时间状况不同
时期指标(可加)
时点指标(不可加)
计量单位
实物单位
自然单位
度量衡单位
标准实物单位
货币单位
劳动单位
注意点
现象的同质性(形成一个统计总体的基础)
要有统一的计量单位
例子
社会总产值、财政支出、国民生产总值、国内生产总值、财政收入
相对指标
定义
反映社会经济现象间的数量对比的关系,是社会经济现象中两个有联系的指标数值对比的比率
计量形式
无名数
抽象化,系数,倍数,百分数,番数
复名数
由分子分母计量单位共同构成,人口密度,人均。。
种类
结构相对指标
结构相对数=(总体部分数值/总体全部数值)*100%
比例相对指标
比例相对数=总体中某部分数值/总体中另一部分数值
比较相对指标
甲地区(单位)某一现象的水平/乙地区(单位)同类现象的水平
计划完成程度相对指标
计划完成相对数=(实际完成数/计划完成数)*100%
根据绝对数来计算
计划完成程度相对数=(实际总水平/计划总水平)*100%
根据相对数或平均数计算
计划完成程度相对数=(实际平均水平(相对数)/计划平均水平(相对数))*100%
根据提高率或降低率计算
计划完成程度相对数=(1+实际提高率(-实际降低率)/1+计划提高率(-计划降低率))*100%
计划执行进度考核
计划执行进度=(累计完成数/全期计划数)*100%
长期计划的检查
水平法
计划完成程度=(计划最末一年实际达到的水平/计划规定的最末一年应该达到的水平)*100%
累计法
计划完成程度=(计划期实际累计完成数/计划期计划累计完成数)*100%
强度相对指标
强度相对数=某一指标数值/另一有联系而性质不同的指标数值
动态相对指标
动态相对数=报告期指标数值/基期指标数值
原则
可比性原则
相对指标和总量指标结合运用原则
相对指标与多个指标结合运用原则
平均指标
概念
又称平均数,是比同类现象在一定时间、地点、条件下所达到的一般水平
特点
将数量差异抽象画
只能就同类现象计算
能反映总体变量的集中趋势
数值平均数
概念
根据数据分布的全部标志值(或变量值)来计算的平均数,也称均值
算术平均数
分母是分子(标志值)的承担者
算术平均数=总体标志总量/总体单位总量
简单算术平均数
加权算术平均数
当各组的次数都相同时,即f1=f2=f3=…=fn 时,加权算术平均数等于简单算术平均数
单项式数列
组距式数列
根据组距式数列计算的加权算术平均数是假定各单位的标志值在组内的分布是均匀的,但实际上分布不可能是完全一致的,各组的组中值与组平均数总会存在一定程度的差异,因此组距式数列计算的算术平均数是一个近似值
影响因素
各组变量值的大小Xi
频数或频率
优缺点
优点
容易理解,便于计算
灵敏度高
缺点
易受极端值影响
在偏斜分布、U型分布中不具有代表性
调合平均数
含义:是算术平均数的变形。是各个变量值的倒数的算术平均数的倒数,故又称倒数平均数
简单调和平均数(未分组资料)
加权调合平均数(分组资料)
注意
调和平均数在应用时要求各个变量均大于零,否则无实际意义
调和平均数也易受极端变量值影响。但受影响程度比算术平均数要小
相比较而言,受极小值的影响比受极大值的影响更大
优缺点
优点
灵敏度高
在某种不能计算的条件下,可以代替算术平均数来计算
缺点
不容易理解
易受极端值影响
有零值时不能计算
几何平均数
含义:是若干项标志值连乘积的n次方根
用途
不是用于计算静态的单位标志值平均数,而是用于计算时间上相互衔接的比率或速度的平均数
也常用于产品合格率、银行复利利率的计算
简单几何平均数(未分组资料)
加权几何平均数(分组资料)
特点
如有标志值为0或负值则无法计算
受极端值的影响较算术平均数和调和平均数小
几何平均数主要应用于反映特定现象的平均水平,即现象的总标志值是各单位标志值的连乘积
三类数值平均数的数量关系
当各变量相等时,调和平均数=几何平均数=算术平均数
当各变量不等时,调和平均数<几何平均数<算术平均数
位置平均数
概念
根据数列中某些标志值所处的位置或地位来确定的
众数
是一个位置代表值,不受极端值的影响。求众数不需要对数据进行排序
如何确定
由未分组或单项式数列确定众数:只需找出出现次数最多的标志值
由组距式数列确定众数
找出频数(频率)最大的组,即“众数组”
按公式近似地计算众数值
特点
不受极值影响
无明显集中趋势时计算众数没有意义
不等距分组众数的位置不好确定
中位数
将总体各单位按其标志值大小顺序排列,处于数列中点的那个单位的标志值
如何确定
未分组的原始资料确定众位数
将标志值按大小顺序排列
确定中位数的位置—(n+1)/2
确定中位数
当n是奇数时,则处于中间位置的标志值就是中位数
当n是偶数时,则处于中间位置的两个标志值的算术平均数就是中位数
由已分组资料确定中位数
计算向上累计数(下限公式)或向下累计数(上限公式)
确定中位数所在组
按公式(内插法)计算中位数
特点
不受极端值和开口组的影响,稳定性好
各单位标志值与中位数离差绝对值之和最小
对某些不具有数学特点或不能用数字测定的现象,可以用中位数求其一般水平
众数、中位数和算术平均数的关系
区别
众数和中位数是由所处的特殊位置确定的,而算术平均数是由数列所有变量值计算的,所以算术平均数对数据的概括能力比众数、中位数强
算术平均数易受极端值的影响,中位数次之,众数几乎不受极端值的影响
联系
三者都是作为反映总体一般水平(或集中趋势)的平均指标
三者之间存在着一定的数量关系
皮尔生经验法则:分布在轻微偏斜的情况下
正确应用平均指标的原则
平均指标只能应用于同质总体
用组平均数补充说明总平均数
根据具体条件选择平均方法
平均数与典型值和分配数列结合分析
标志变异指标
定义:是反映同质总体内部各单位标志值的差异程度,即数列的离散趋势的指标
作用
衡量平均指标的代表性
反映现象变动的均衡性
是进行抽样推断等统计分析的一个基本指标(可以计算抽样平均误差)
全距(极差)
全距越大,数据的离散程度越大
指一组资料中的最大值与最小值之差,表明总体中标志值变动的范围
未分组资料
全距R=最大值-最小值
分组资料
最大组的上限-最小组的下限
对开口组
最大组的上限=前一组的上限+组距
最小组的下限=后一组的下限-组距
意义明确,计算简单;只考虑极值的大小而不考虑其他变量值的分布情况,会导致测定数列的离散程度不全面
四分卫差
四分位差越大,数据的离散程度越大
也称修正极差,它集中反映中间50% 的离散程度
平均差
平均绝对偏差,各单位的标志值与平均数的离差绝对值的算术平均数
未分组资料(简单)
分组资料(加权)
特点
概括地反映了所有单位标志值的变异程度,但因取绝对值,数学性质不理想,实际中较少用
标准差
方差与标准差是测量标志变异程度最常用的指标;数值越大,反映偏离程度越大
总体各单位标志值与其算术平均数的离差平方和的平均数的平方根。又称“均方差”
未分组资料
方差
标准差
分组资料
方差
标准差
步骤
确定各组组中值
计算平均数
算出离差
计算各组离差平方,乘以各组次数fi
求出分子离差平方和,带入公式得到结果
离散系数
也称变异系数,是各变异指标与其算术平均数的比值
极差系数
四分卫差系数
平均差系数
标准差系数
作用:消除现象由于不同计量单位、不同平均水平所产生的影响
属性总体
也叫是非总体,其总体单位的标志值分为具有某种标志的单位和不具有某种标志的单位
eg.
性别(男、女) 产品是否合格(合格、不合格)
表示
用“1”表示具有某种标志
用“0”表示不具有某种标志
平均值
标准差
时间数列
概念
社会经济现象总是随着时间的推移而变化呈现动态性。统计对事物进行动态研究的基本方法是编制时间数列。时间数列又称动态数列或时间序列,指同类指标在不同时间的数值,按时间先后顺序排列而形成的数列
构成要素
资料所属的时间
在一定时间条件下的统计指标数值
作用
反映现象发展变化的过程和结果
研究现象发展变化的方向、水平、速度和趋势
建立模型,对现象进行趋势分析和预测
对相互联系的时间数列可以进行对比分析或相关分析
种类
绝对数时间数列
最基本的数列
时期数列(可加性、与时间的关联性、连续登记)
时点数列
相对数时间数列
由基本时间数列派生的数列
平均数时间数列
由基本时间数列派生的数列
编制原则
可比性原则
基本原则
时间长短(或间隔)一致
总体范围一致
经济内容一致
计算方法、计算价格、计量单位一致
水平分析指标
发展水平
时间数列每一项指标数值就是发展水平,表现形式可以是绝对数、相对数、平均数 常用a0、a1、…、an-1、an表示
分类
按发展水平的位置分类
按在研究中的作用分类
报告期水平和基期水平不是固定不变的 “增加到”与“增加了” “降低到”与“降低了”
报告期水平
时间数列指标所研究的那个时期的发展水平
基期水平
用来对比的基础时期的发展水平
平均发展水平(序时平均数)
是对时间数列中各期发展水平计算的平均数。又称序时平均数或动态平均数
对绝对数时间数列计算平均发展水平
时期数列的序时平均数
时点数列的序时平均数
连续时点数列的序时平均数
逐日登记并逐日给出资料
逐日登记但仅在时点指标值发生变动时给出资料(fi是每次变动持续的间隔长度)
间断时点数列的序时平均数
间断时点数列是间隔一段时间对现象在某一时间所表现的状况进行一次性登记,并按照登记数据按照时间的先后顺序排列所形成的时间数列
表现为期初或期末值
假设上期末水平等于本期初水平
假定现象在间隔期内的数量变动时均匀的
计算步骤
计算各间隔期的平均数
以间隔期为权数,对各间隔期的平均水平再进行加权算术平均
对相对数列或平均数列计算平均发展水平
基本公式
先平均,后对比 必须首先分清楚,分子、分母数列是属于时期数列,还是属于时点数列,然后分别计算各自的序时平均数,最后对比
增长量与平均增长量
增长量
指某种现象在一定时期内所增长的绝对数量(可正、可负、可为零)
增长量=报告期水平-基期水平
逐期增长量和累计增长量的关系 逐期增长量之和= 累计增长量 两相邻时期的累计增长量之差=相应时期的逐期增长量
年距增长量
对受季节影响较大的现象,使用年距增长量指标进行分析,可排除季节变动的影响(适用于月度或季度数据的对比)
年距增长量=本期发展水平-去年同期发展水平
平均增长量
是逐期增长量的序时平均数,表现该现象在一定时期内增长的一般水平
速度分析指标
发展速度
两个不同时期发展水平之比,表明报告期水平已发展到基期水平的百分之几或若干倍
发展速度=报告期水平/基期水平
根据采用的基期不同
环比发展速度
定基发展速度(总速度)
关系
环比发展速度的连乘积=定基发展速度
相邻两个定基发展速度的商=环比发展速度
年距发展速度
报告期与上年同期水平对比达到的相对程度,消除季节变动的影响,是实际统计分析中经常使用的指标
年距发展速度=本期发展水平/上年同期发展水平
平均发展速度
反映现象在一定时期内逐期发展变化的一般水平。是各期环比发展速度的序时平均数
几何平均法(水平法)
各期计算出的理论水平与各期实际水平并不全部相等 但最末一期计算水平与实际水平相等
n指环比发展速度的个数,即时间数列项数-1
方程式法(累计法)
推算的各期水平之总和与实际相等
增长速度
某种现象报告期的增长量与基期水平之比。表明报告期水平比基期水平增长(或降低)了百分之几或若干倍
按选择的基期不同
环比增长速度=环比发展速度-1
定基增长速度=定基发展速度-1
年距增长速度=年距发展速度-1
发展速度>100% ,增长速度为正,表示报告期比基期增长;反之则相反
平均增长速度
反映现象在一定时期内逐期增长(降低)变化的一般水平
不能直接计算,只能通过与平均发展速度的数量关系来进行:平均增长速度=平均发展速度-1
注意
定基增长速度并不等于相应时期的环比增长速度的连乘积
相邻两个时期的定基增长速度之比不等于相应时期的环比增长速度
当时间序列中的观察值出现0或负数,不宜计算速度,在这种情况下,适宜直接用绝对数(如租期增长量)进行分析
速度指标数值的大小与基期水平的高低密切相关
增长1%的绝对值
将速度与水平二者结合—常常用到增长1%的绝对值来补充说明增长速度
可避免高速度掩盖低水平或速度背后的高水平
是绝对指标,指报告期比基期每增长1% 所代表的实际数量
因素分析
影响时间数列的主要因素
长期趋势(T)
又称趋势变动,指时间数列在较长持续期内表现出来的总态势
是由现象内在的根本性的、本质因素决定的,支配着现象沿着一个方向持续上升、下降或在原有水平起伏波动
造成长期趋势的是一些缓慢发生作用的因素,如人口的增长、资本的积累、技术的进步、消费习惯的改变等
季节变动(S)
由于自然季节因素(气候条件)或人文习惯季节因素(节假日)更替的影响,时间数列随季节更替而呈现的周期性变动
季节周期通常以“年”为周期;也有以“季度、月、周、日”为周期的准季节变动
循环变动(C)
时间数列中以若干年为周期、上升与下降交替出现的循环往复的运动
经济增增长中的商业周期:繁荣—衰退—萧条—复苏—繁荣
循环变动与长期变动趋势不同,它不是单一方向的持续变动,而是有涨有落的交替波动。且比季节变动的周期长
可解释的变动
不规则变动(I)
由于偶然性因素的影响而表现出的不规则波动。故也称不规则运动
成因:自然灾害、意外事故、政治事件;大量无可言状的随机因素的干扰
不可解释的变动
分析模型
假定四种变动因素相互独立
Y=T+S+C+I
同计量单位
假定四种变动因素存在交互关系
Y=T*S*C*I
Y 、T 同计量单位,S 、C 、I 用百分数
长期趋势的测定
目的和意义
更好地认识和掌握现象变化发展的规律,为制定计划提供依据
为时间数列的预测奠定基础
从时间数列中剔除长期趋势的影响,便于分析其他因素
测定长期趋势的方法
时距扩大法
将时间数列的时间单位予以扩大,并将相应时间内的指标值加以合并,从而得到一个扩大了时距的时间序列
最原始、最简便,消除了较小时距单位内偶然因素的影响,显示现象变动的基本趋势
对于时期数列,时距扩大后只需根据新的时间长度累加原有指标值
对于时点数列,可按新的时间长度计算原有指标的序时平均数
移动平均法
将时间数列的时距扩大,按一定项数(N )逐项依次移动,边移动边求序时平均数,是测定时间数列趋势变动的基本方法
序时平均数形成的新数列消除或削弱了原数列中的由于短期偶然因素引起的不规则变动和其他成分,对原数列的波动起到修匀作用,从而呈现出现象在较长时期的发展趋势,但不适合对现象未来的发展趋势进行预测
平均的时距项数越大,对数列的修匀作用越强
移动项数为奇数,进行一次移动
较原数列首尾各减少(N-1)/2项
移动项数为偶数,进行两次移动
—较原数列首尾各减少N/2项
趋势模型法
用一定的数学模型,对原有的时间数列配合一条适当的趋势线来进行修匀。通过趋势线来描述时间数列的趋势变化来进行预测
步骤
直接观察法(散点图法)
增长特征法
一级(逐期)增长量大致相等—直线趋势方程
b 的经济意义:数列水平的平均增长量
简化公式,令t的总和为0
二级增长量大致相等—抛物线方程
环比发展速度大致相等—指数曲线方程
最理想的趋势线是最接近所有各散点的趋势线
原数列与趋势线的离差平方和为最小
原数列与趋势线的离差总和为零
季节变动的测定
方法
同期平均法
不考虑长期趋势的影响,根据原始动态数列直接去测定(按月(季)平均法)
步骤
计算各年同季的平均数
计算各年所有季度的总平均数
计算各季度的季节比率
移动平均趋势剔除法
根据剔除长期趋势后的数据测定季节变动
步骤
计算移动平均数,得到长期趋势值和循环变动值T*C
用原数列各项数据y对应地除以趋势值,得y/(T*C),从而消除了长期趋势和循环变动的影响
对新数列采用同期平均法,消除不规则变动得季节比率
资料要求
长时间
至少有三个周期以上的统计资料
短时距
一年以内短时间单位(月、季)的资料
统计指数
统计指数概述
概念
广义
泛指一切说明现象数量变动或差异程度的相对数
狭义
是综合反映不能直接加总的、多因素所构成的复杂社会经济现象总体综合变动程度的一种特殊相对数
性质
相对性
统计指数通常以相对数的形式表示
综合性
综合反映多种事物所构成的复杂总体的变动
平均性
多种事物平均意义上的变动
作用
综合反映复杂社会现象总体的变动方向和程度
分析多因素影响现象得到总变动中,各个影响因素的影响大小和方向
测定研究现象在长时间内的发展变化趋势
分类
按考察范围分
个体指数
反映单项事物变动的相对数
总指数
反映多个事物构成的复杂现象总体综合变动的相对数
类指数
介于个体指标指数与总指数之间
按指标性质分
数量指标指数
说明数量指标变动程度的相对数,如产品产量指数、商品销售量指数、职工人数指数
质量指标指数
说明总体内涵数量变动情况的指数,即反映质量指标变动程度的相对数,如商品价格指数、产品单位成本指数、工资水平指数
按编制方法分
综合指数
通过两个有联系的综合总量指标对比计算的总指数
平均数指数
是从个体指数出发,对个体指数运用加权平均的方法计算出来的指数,常常作为综合指数的变形而使用
平均指标对比指数
通过两个加权算术平均指标对比计算出来的指数,也称可变构成指数
按基期不同分
定基指数
以某一固定时期水平作为对比基期的指数,如股票价格指数
环比指数
以前一时期的水平作为对比基期的指数,如环比CPI 指数
综合指数
先综合后对比
综合指数是总指数的基本形式,将不能直接相加或对比的复杂现象,通过同度量因素的引入过渡到能够相加的价值量指标,再将两个不同时期的价值量综合指标对比计算指数的一种方法
综合指数编制的关键问题
确定指数化因素
指需通过指数的编制测定其变化程度的那个因素
确定同度量因素
使不同度量的现象过渡(转化)成可以同度量的媒介因素
确定同度量因素的时期
拉氏指数
同度量因素固定在基期
只反映指数化指标的变化,不受同度量因素变动的影响
帕氏指数
同度量因素固定在报告期
不仅反映指数化指标的变化,还受同度量因素变动的影响,比拉氏指数更具现实意义
注意
数量指标指数以基期质量指标为同度量因素
e.g.销售量指数
质量指标指数以报告期数量指标为同度量因素
e.g.价格指数
平均数指数
先对比后平均
平均数指数是个体指数的加权平均数
编制方法
加权算术平均数指数
计算个体指数:个体数量指数
获取价值总量qp的资料,其中以基期价值总量q0p0最为常用
以个体指数为变量,基期价值总量为权数,以加权算术平均的形式求的总指数
加权调和平均数指数
计算个体指数
获取价值总量qp的资料,其中以报告期价值总量q1p1最为常用
以个体指数为变量,报告期价值总量为权数,以加权调和平均的形式求得总指数
注意
作为一种独立指数形式的平均数指数,和综合指数的形式是不一样的
综合指数的计算通常采用全面资料,平均数指数通常采用抽样调查的资料,它本身具有广泛的使用价值
指数体系与因素分析
概念
狭义:仅指几个指数之间在一定的经济联系基础上所结成的较为严密的数量关系式。其表现形式为—一个总变动指数等于两个(或两个以上)因素指数的连乘积
作用
指数推算
根据已知的指数推算未知的指数
因素分析
分析现象的总变动中,各有关因素的影响方向和影响程度
因素分析
利用指数体系,从相对数和绝对数两方面分析现象的总变动中各个因素的影响方向和影响程度,目的是找出影响现象变动的主要因素
分类
按分析指标的表现形式不同
总量指标变动因素分析
平均指标变动因素分析
按影响因素的多少
两因素分析
多因素分析
总量指标的两因素分析
建立指数体系
总变动指数=数量指标指数*质量指标指数
计算被分析指标的总变动
计算各影响因素变动的影响程度和绝对值
影响因素的综合分析
总变动程度等于各影响因素变动程度的连乘积
总变动绝对值等于各影响因素变动的绝对值之和
总量指标的多因素分析
凡是影响因素在三个或三个以上时,运用指数体系进行因素分析,被称为多因素分析
注意
对各影响因素排序,一般是数量指标在前,质量指标在后;相邻两指标的乘积一定要有明确的经济含义
分析某因素的变化时,其余因素均作为同度量因素固定。同度量因素时期的确定遵循连环替代原则:即分析第一个因素的影响时(数量指标指数),把其余因素作为同度量因素,并将其固定在基期;分析其后因素的影响时,已经分析过的因素固定在报告期,未分析的固定在基期
平均指标变动指数的因素分析
通过两个加权算术平均指标对比计算的指数
可变构成指数=结构影响指数*固定构成指数
可变构成指数(平均指标对比指数)
指在分组条件下,综合反映结构和水平两个因素共同变化所引起的总平均水平的变动指数
变动指数
绝对额
结构影响指数
反映总体结构变化对总平均水平变动影响程度的指数(同度量因素为各组的平均水平且固定在基期)
变动指数
绝对额
固定构成指数
反映各组平均水平变动影响程度的指数(同度量因素为总体结构且固定在报告期)
变动指数
绝对额
关系
可变构成指数=结构影响指数*固定构成指数
在各组单位数的变动按等比例变化时,结构变动影响指数等于1
统计指数的应用
居民消费价格指数(CPI)
通常被用来反映通货膨胀或通货紧缩程度的指标
CPI 采用固定加权算术平均公式编制
分类
年度CPI
以上年为基期
月度CPI
以上年同期为基期的同比指数
以上月为基期的月环比指数
应用
反映通货膨胀
通货膨胀率=(报告期CPI指数/基期CPI指数)*100%-100%
通货膨胀率>0说明通货膨胀,反之则相反
测定货币购买力变化
货币购买力指单位货币所能购买到的消费品和服务
货币购买力指数=1/CPI
指数<100%表示货币购买力下降,物价上涨,反之则相反
相关与回归分析
相关分析:用一个指标来表明现象间相互依存关系的密切程度 回归分析:根据相关关系的具体形态选择一个合适的数学模型(称为回归方程式),用来近似地表达变量间的平均变化关系
联系
相关分析需要依赖回归分析来表明现象间的具体数量依赖关系
回归分析需要依靠相关分析来表明变量间的密切程度
只有当变量之间存在着高度相关时,进行回归分析才有意义
区别
研究事物的相互关系、测定它们联系的紧密程度、揭示其变化的具体形式和规律性的统计方法,是经济分析、预测和控制的重要工具
相关分析
相关关系的概念
经济变量之间数量联系存在两种不同的类型
函数关系
客观现象之间存在严格的数量上的依存关系
特点
现象之间存在数量上的依存关系
现象之间的数量依存关系值是固定的
各观测点落在一条线上
相关关系
客观现象之间确实存在,但在数量上表现为不确定或不严格的相互依存关系
特点
现象之间确实存在数量上的依存关系
现象之间的数量依存关系值是不固定的
各观测点分布在线周围
区别与联系
区别
具有函数关系的变量之间的数量关系是确定的,而具有相关关系的变量之间的数量关系是不确定的
函数关系中变量之间存在因果联系(自变量为因,因变量为果),相关关系中两个变量之间不一定存在因果关系
联系
由于存在认识局限或测量误差,函数关系在实际中往往表现为相关关系
在研究相关关系时,常常使用函数关系的形式来找到相关关系的一般数量表现形式
具相关关系的变量之间的联系,如果我们能把影响其数量联系关系的其他所有因素都纳入考虑,则相关关系也可以转化为函数关系
相关关系的种类
按相关的因素多少
单相关
两个因素之间的相关关系。e.g.投资额与GDP之间的关系
复相关
一个变量对两个或两个以上其他变量的相关关系。e.g.某种商品的需求量Q与其价格水平P以及收入水平(income)之间的相关关系
按相关的方向
正相关
e.g.家庭消费支出随收入增加而增加
负相关
e.g.劳动生产率提高,产品成本降低
按相关的表现形式
直线相关
e.g.消费水平与收入水平
曲线相关
e.g.产品的平均成本与产品总产量
按相关的密切程度
不相关
不完全相关
大多数相关关系属于不完全相关,是统计研究的主要对象
完全相关
相关关系成为函数关系(函数关系是相关关系的一种特殊情况)
相关分析的内容
确定现象之间是否存在相关关系
确定现象之间的相关关系的表现形式
判定现象之间相关关系的方向和密切程度
简单线性相关分析
步骤
定性分析:现象之间是否有相关关系
定量分析
绘制相关表或相关图,初段断定相关方向、形式、程度
计算相关系数,精确判断
相关表与相关图
相关表
将一变量的变干变量值按从小到大的顺序排列,并将另一变量或多个相关变量的值与之对应排列形成的统计表
相关图
又称散点图。将两个变量间相对应的变量值用坐标点的形式描绘出来,以表明相关点的分布状况
相关系数
高度相关的相关系数的绝对值>0.8
相关系数的概念
说明变量之间线性相关密切程度的指标
总体相关系数
根据总体全部数据计算
样本相关系数
根据样本数据计算
相关关系的测度—皮尔逊系数
一元线性回归分析
根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系
特点
在变量之间,必须根据研究目的的具体确定哪些是自变量,哪些是因变量
回归方程的作用在于,在给定自变量的数值情况下,估计因变量的可能值。一个回归方程只能做一种推算。推算的结果表明变量之间的变动关系
直线回归方程中,回归系数的符号为正时,表示正相关;回归系数的符号为负时,表示负相关(即回归系数b与相关系数r的符号相同)
在确定回归方程时,只要求因变量是随机的,而自变量一般是给定的数值
形式
回归系数b 的经济含义:当自变量变动一个单位时,因变量的平均变动值
参数a、b的最小二乘估计
寻找一条总的看来离各散点最近的一条直线,使实际值y与相应的理论值yc之间的误差达到最小
步骤
回归分析强调“平均”
如果给定自变量X一个值,因变量Y有若干值与之对应,这些值虽然表现出一定的随机性、波动性,但是又总是按一定的分布规律围绕因变量的均值上下波动,即对于自变量的的某个确定值,因变量有一个平均值与之对应
回归估计标准误差
概念
指因变量实际值与估计值的标准差。反映实际值与估计值之间的平均差异程度
计算公式
作用
是衡量回归直线代表性大小的统计分析指标,它说明观察值围绕着回归直线的变化程度或分散程度
回归估计标准误差越小,实际值与估计值的平均差异程度越小,估计值(或回归方程)的代表性越强,进行估计或预测的结果越准确
一元线性回归估计模型的区间估计
相关系数的绝对值大小与回归估计标准误差呈反向关系
区别
强度相对数是由两个不同质但有联系的总体的指标数值对比求得;平均数在同质总体内进行计算的
强度相对数的分子与分母不存在一一对应关系;平均数的分子与分母是一一对应关系
强度相对数反映现象的强弱程度、密度、经济效果等;平均数是反映一般水平或集中趋势的
关系及应用条件
加权算术平均数和加权调和平均数的关系:在权数选择合适时,加权调和平均数实际上是加权算术平均数的变形
加权算术平均数一般用于已知分母的情况下。即总体单位
加权调和平均数一般用在已知分子的情况下。即总体标志总量已知
注意
利用全距、标准差等变异指标比较两数列离散程度的条件: 1.两数列的平均数相等 2.两数列的计量单位相同 如果不满足上述条件,则应用离散系数(变异系数)来判断
静态平均数与序时平均数的异同
子主题
关系
在资料完全相同的情况下,基期加权算术平均数指数恒等于拉氏综合物量指数
关系
在资料完全相同的情况下,报告期加权的调合平均数指数恒等于帕氏综合质量指数(报告期加权是为了突出指数的经济意义)