导图社区中级经济师-经济基础知识笔记-23-27统计

中级经济师-经济基础知识笔记-23-27统计

这是一篇关于中级经济师-经济基础知识笔记-23-27统计的思维导图。该思维导图归纳总结了关于这一部分的知识点，比较系统全面。

编辑于2021-09-18 19:57:25

方差
平均发展…

袁海

他的近期作品查看更多>>

中级经济师-经济基础知识笔记-23-27统计

社区模板帮助中心，点此进入>>

袁海

他的近期作品查看更多>>

相似推荐
大纲

英语词性
- 57.8k
- 6.2k
- 2.3k
- 577
Ethan
法理
- 24.9k
- 65
- 368
- 54
Dasein
刑法总则
- 33.8k
- 145
- 951
- 162
Dasein
【华政插班生】文学常识-先秦
- 1.2k
- 4
- 69
- 2
Dasein
【华政插班生】文学常识-秦汉
- 833
- 0
- 54
- 10
Dasein
文学常识：魏晋南北朝
- 2.3k
- 3
- 90
- 20
Dasein
【华政插班生】文学常识-隋唐五代
- 2.0k
- 8
- 98
- 6
Dasein
民法分论
- 5.9k
- 37
- 289
- 29
Dasein
日语高考動詞の活用
- 1.7k
- 7
- 63
- 8
鱼子酱
第14章DNA的生物合成读书笔记
- 18.2k
- 20
- 448
- 91
小凡

统计

统计与数据科学

一、统计学

描述统计

研究：数据收集、整理、描述的统计学方法。

包括：

1、如何取得需要的数据

2、如何运用图表或数学方法对数据进行整理和展示

3、如何描述数据的一般特征

推断统计

研究：如何利用样本数据来推断总体特征的统计学方法。

包括：

1、参数估计

利用样本信息推断总体特征

2、假设检验

利用样本信息判断对总体的假设是否成立

二、变量和数据

变量

是研究对象的属性或特征，它是相对于常数而言的。

定量变量（数量变量）

变量的取值为数量

定性变量

分类变量

变量的取值为分类

顺序变量

变量的取值为分类且具有一定的顺序

数据

是对变量进行测量、观测的结果

三、数据的来源

观测数据和实验数据

通过直接调查或测量而收集的数据，称为观测数据。

通过实验中控制实验对象以及所处的实验环境收集到的数据，称为实验数据。

一手数据和二手数据

一手数据的主要来源：1）调查或观察；2）实验

四、统计调查

1、按调查对象的范围不同

全面调查

非全面调查

2、按调查登记的时间是否连续

连续调查

不连续调查

3、统计调查的方式

1）统计报表

收集统计数据的一种重要方式

2）普查

3）抽样调查

4）重点调查

5）典型调查

五、数据科学与大数据

大数据的4V特性

1、数据量大（Volume）

2、数据多样性（Variety）

3、价值密度低（Value）

4、数据的产生和处理速度快（Velocity）

数据挖掘（Data Mining）的常用方法

分类、聚类分析

关联分析

趋势与演化分析

特征分析

异常分析

数据可视化

科学可视化

面向科学与工程领域的数据

信息可视化

非结构化、非几何的抽象数据

描述统计

一、集中趋势的测度

指一组数据向某一中心值靠拢的程度，它反映了一组数据中心点的位置所在。

1、均值

也叫平均数，计算公式

2、中位数

一组数从小到大排列，位置居中的数，用Me表示。中位数是一个位置代表数，主要用于顺序数据和数值型数据，但不适用于分类数据。

3、众数

指一组数据中，出现频率最多的变量值

二、离散程度的测度

离散程度反映的是数据之间的差异程度，数据的离散程度越大，集中趋势的测度值对该组数据的代表性就越差，反之则越好。

1、方差

是数据组中各数值与其均值离差平方的平均数，它能较好地反映出数据的离散程度，是实际中应用最广泛的离散程度测度值。

对于总体数据，有2种常用计算公式

总体方差公式∑

总体方差公式S

对于样本数据，常用的计算公式：

对于有放回的简单随机抽样中，小s样本方差是∑总体方差的无偏估计量。

对于无放回的简单随机抽样中，小s样本方差是大S总体方差的无偏估计量。

2、标准差

标准差即方差的平方根

3、离散系数

也称“变异系数”、“标准差系数”，即：标准差与均值的比值，记为（Coefficient Variation，CV）。

三、分布形态的测度

1、偏态系数

偏度指数据分布的偏斜方向和程度，描述的是数据分布对称程度。偏态系数是测度数据分布偏度的统计量，取决于离差三次方的平均数与标准差三次方的比值。偏态：Skew

若SK=0，说明数据的分布式对称的；

若SK＞0，说明数据的分布式右偏的；0-0.5之间，说明轻度右偏；0.5-1之间说明中度右偏；大于1说明严重右偏。

若SK＜0，说明数据的分布式左偏的；0-负0.5之间，说明轻度左偏；负0.5-负1之间说明中度左偏；小于负1说明严重左偏。

2、标准分数

也称“Z分数”，可以给出数值距离均值的相对位置，标准分数=（数值-均值）/ 标准差。

所有数据的“标准分数的平均数”=0， “标准分数的标准差”=1

当数据服从对称的钟形分布时，经验法表明：约68%的数据与平均数的距离在1个标准差之内，即标准分数在[-1,+1]范围内；约95%的数据与平均数的距离在2个标准差内，即：标准分数在[-2,+2]范围内；约99%的数据与平均数的距离在3个标准差内，即：标准分数在[-3,+3]范围内。

四、变量间的相关分析