导图社区 第二十四章描述统计
2021年经济基础的知识总结,包括数据分布特征的测度分为、集中趋势的测度、离散程度的测度、变量间的相关分析、分布形态的测度等内容。
2021年经济基础的知识总结,包括市场供给、供给的含义、影响供给的因素、供供给曲线的形状及变动、均衡价格、弹性等内容。
2021年经济基础的知识总结,包括市场结构类型结构、完全竞争市场中生产者的行为、完全垄断市场中生产者的行为、垄断竞争市场和寡头垄断市场中生产者的行为等内容。
2021年经济基础的知识总结,包括中央银行制度、中央银行的职责和业务活动特征、中央银行的主要业务、货币政策定义、货币政策目标、货币政策工具、货币政策的中介目标、货币政策传导机制、近年来我国货币政策的实践等内容。
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
第二十四章描述统计
数据分布特征的测度分为
分布的集中趋势
反映个数据向其中心值靠拢或聚集的程度
分布的离散程度
反映个数据之间的差异程度,也能反映中心值对数据的代表程度
分布的偏态
反映数据分布的不对称性
集中趋势的测度
指一组数据向某一中心值靠拢的倾向,反映了一组数据中心点的位置所在。集中趋势测度也就是寻找数据一般水平的代表值或中心值
均值
也叫平均数,是数据组中所有数值的总和除以该组数值的个数
是集中趋势中最主要的测度值 主要适用于数值型数据,不适用于分类数据和顺序数据,均值容易受极端值的影响
中位数
把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数
中位数奇数
=(N+1)/2
中位数偶像
中位数是一个位置代表值,主要用于顺序数据和数值型数据,不适用于分类数据 优点是不受极端值的影响,抗干扰性强,适用于收入这类偏斜分布的数值型数据
众数
指一组数据中出现次数最多的变量值
适于描述分类数据和顺序数据,不适用于定量数据
离散程度的测度
反映数据之间的差异程度
数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差,离散程度越小,其代表性就越好
方差
是数据组中各数值与其均值离差平方的平均数
=(X-X1)的平方/N
=(X-X1)的平方/N-1
方差能较好的反映出数据的离散程度。实际中应用最广泛的离散程度测度值。方差越小,说明数值与均值的平均距离越小,均值代表性越好
标准差
标准差即方差的平方根,不仅能度量数值与均值的平均距离,还与原始数值具有相同的计量单位
适用于数值型数据,易受极端值的影响
离散系数
也称为变异系数或标准差系数,即标准差与均值的比值
消除了测度单位和观测值水平不同的影响,因而可以直接用来比较变量的离散程度
变量间的相关分析
按相关的程度分为
完全相关
一个变量的取值变化完全由另一个变量的取值变化所确定
不完全相关
两个变量之间的取值变化彼此互不影响
不相关
结余完全相关和不相关之间
按相关的方向
正相关
一个变量的取值由小变大,另一个变量的取值也相应由小变大
负相关
一个变量的取值由小变大,另一个变量的取值相反地由大变小
按相关的形式
线性相关
呈现为线性关系
直线关系
非线性相关
并不表现为直线的关系,近似于某种曲线方程的关系
相关关系并不等同于因果关系
散点图
两个变量之间的关系可以用散点图来展示
无规律可言,表示这两个变量不相关
呈曲线模式,表示两个变量为非线性相关
在一条直线周围,这两个变量为正相关关系
点密集在一条直线周围,这两个变量为负相关关系
相关系数
最常用的相关系数是pearson皮尔逊相关系数 取值范围在【-1,1】之间 只是用线性相关关系
分布形态的测度
偏态系数
偏度
指数据分布的偏斜方向和程度,描述的是数据分布对称程度
测度数据分布偏度的统计量
取决于离差三次方的平均数与标准差三次方的比值 偏态系数绝对值越大,说明数据分布的偏斜程度越大
标准分数
不同变量的数值是不能比较的,每个数值在变量分布中相对于均值的相对位置是可比的
通过计算标准分数来比较不同变量的取值
用数值减去均值所得的差除以标准差
标准分数的平均数为0,标准差为1
可以运用经验法则来判断与均值的距离在特定倍数标准差之内的数据项所占比例
约有68%的数据与平均数的距离在1个标准差之内,标准分数在【-1,1】范围内
约有95%的数据与平均数的距离在2个标准差之内,标准分数在【-2,2】范围内
约有99%的数据与平均数的距离在1个标准差之内,标准分数在【-3,3】范围内