导图社区 经济基础第二十四章描述统计
经济基础第二十四章描述统计知识点总结,系统地介绍了集中趋势和离散程度的概念、测度方法以及它们在描述统计学中的应用以及变量间的相关分析,介绍详细,可以作为学习笔记和复习资料,帮助大家系统地回顾和巩固所学知识,学生更好地理解和记忆知识。
编辑于2024-07-03 14:31:53第一章企业战略与经营决策-企业战略类型知识点总结,包含基本竞争战略、企业成长战略、企业稳定战略、企业紧缩战略。
24版工商管理第一章企业战略和经营决策-企业战略分析,企业战略指企业在激烈的市场经济竞争环境中,在总结历史经验、调查现状、预测未来的基础上,为谋求自我生存和发展而做出的长远性、全局性的谋划。
如何提升直播间流量竞争力,详细概述了如何提升直播间流量竞争力的多方面策略。强调了提升直播间流量竞争力的全方位策略,包括优化直播场景、增强主播能力、精准选品与排品、利用数据指导决策以及加大流量投放等。通过这些策略的综合运用,可以有效提升直播间的流量承接力和转化率,从而实现销售额的增长。
社区模板帮助中心,点此进入>>
第一章企业战略与经营决策-企业战略类型知识点总结,包含基本竞争战略、企业成长战略、企业稳定战略、企业紧缩战略。
24版工商管理第一章企业战略和经营决策-企业战略分析,企业战略指企业在激烈的市场经济竞争环境中,在总结历史经验、调查现状、预测未来的基础上,为谋求自我生存和发展而做出的长远性、全局性的谋划。
如何提升直播间流量竞争力,详细概述了如何提升直播间流量竞争力的多方面策略。强调了提升直播间流量竞争力的全方位策略,包括优化直播场景、增强主播能力、精准选品与排品、利用数据指导决策以及加大流量投放等。通过这些策略的综合运用,可以有效提升直播间的流量承接力和转化率,从而实现销售额的增长。
经济基础第二十四章描述统计
描述统计
在描述统计中,可以通过统计量描述数据的分布特征。对于数据分布特征的测度主要分为三个方面
1. 分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度
2. 分布的离散程度,反映各数据之间的差异程度,也能反映中心值对数据的代表程度
3. 分布的偏态,反映数据分布的不对称性。对于两个定量变量之间的相关分析,经常采用的描述方法是散点图和相关系数统计量
集中趋势的测度
集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。集中趋势的测度也就是寻找数据水平的代表值或中心值
1. 均值
均值也叫作平均数,就是数据组中所有数值的总和除以该组数值的个数。设一组数据为X1,X2,…,Xn,平均数X的计算公式为:X=(X1+X2+…+Xn)/n
均值是集中趋势最主要的测度值,它是一组数据的重心所在,解释了一组数据的平均水平。它主要适用于数值型数据,但不适用于分类数据和顺序数据
均值容易受到极端值的影响,极端值会使得均值向极大值或极小值方向倾斜,使得均值对数据组的代表性减弱
2. 中位数
把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫作中位数,用M表示。中位数将数据分成两部分,其中一半数据小于中位数,另一半数据大于中位数。设一组数据为X1,X2,…,Xn,按从小到大顺序为X(1),X(2),…,X(),则中位数为:
中位数是一个位置代表值,主要用于顺序数据和数值型数据,但不适用于分类数据。中位数的优点是不受极端值的影响,抗干扰性强,尤其适于收入这类偏斜分布的数值型数据
3. 众数
众数是指一组数据中出现次数(频数)最多的变量值
众数适用于描述分类数据和顺序数据的集中趋势。而在定量数据中,可能出现多众数和无众数的情况,因此众数不适用于描述定量数据的集中位置
4. 均值、中位数和众数的比较及适用范围
1. 均值适于定量变量。优点是能够充分利用数据的全部信息,均值大小受每个观测值的影响,比较稳定;缺点是易受极端值的影响,如果观测值中有明显的极端值,则均值的代表性较差
2. 中位数不适于分类变量,适于顺序变量和定量变量,特别是分布不对称的数据。优点是不受极端值的影响;缺点是没有充分利用数据的全部信息,稳定性差于均值,优于众数
3. 众数不适用于定量变量,主要适用于分类和顺序变量。优点是不受极端值的影响,尤其是分布明显呈偏态时,众数的代表性更好;缺点是没有充分利用数据的全部信息,缺乏稳定性,而且可能不唯一
离散程度的测度
离散程度反映的是数据之间的差异程度。集中趋势的测度值是对数据水平的一个概括性的度量,它对一组数据的代表程度,取决于该组数据的离散水平。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差,离散程度越小,其代表性就越好
1. 方差
方差是数据组中各数值与其均值离差平方的平均数,它能较好地反映出数据的离散程度,是实际中应用最广泛的离散程度测度值。方差越小,说明数据值与均值的平均距离越小,均值的代表性越好
2. 标准差
用标准差来测度数据的离散程度,标准差即方差的平方根。标准差不仅能度量数值与均值的平均距离,还与原始数值具有相同的计量单位
标准差与方差计算比较简便,又具有比较好的数学性质,是应用最广泛的统计离散程度的测度方法。但是标准差与方差只适用于数值型数据。此外,与均值一样,它们对极端值也很敏感
3. 离散系数
离散系数也称变异系数或标准差系数,即标准差与均值的比值,主要用于不同类别数据离散程度的比较,记为CV。离散系数计算公式为CV=S/X
标准差的大小不仅与数据的测度单位有关,也与观测值的均值大小有关,不能直接用标准差比较不同变量的离散程度。离散系数消除了测度单位和观测值水平不同的影响,因而可以直接用来比较变量的离散程度
分布形态的测度
1. 偏态系数
偏度是指数据分布的偏斜方向和程度,描述的是数据分布对称程度。测度数据分布偏度的统计量称为偏态系数,其计算公式为
偏态系数取决于离差三次方的平均数与标准差三次方的比值,偏态系数的绝对值越大,说明数据分布的偏斜程度越大
1. 如果偏态系数等于0,说明数据的分布是对称的
2. 如果偏态系数为正值,说明分布为右偏的,取值在0和0.5之间说明轻度右偏,取值在0.5和1之间说明中度右偏,取值大于1说明严重右偏
3. 如果偏态系数为负值,说明分布为左偏,取值在0和-0.5之间说明轻度左偏,取值在-0.5和-1之间说明中度左偏,取值小于-1说明严重左偏
2. 标准分数
标准分数可以给出数值距离均值的相对位置,计算方法是用数值减去均值所得的差除以标准差,计算公式为Zi=(Xi-X)/s
变量间的相关分析
变量间的相关关系
1. 按相关的程度可分为完全相关、不完全相关和不相关
1. 当一个变量的取值变化完全由另一个变量的取值变化所确定时,称这两个变量间的关系为完全相关
2. 当两个变量的取值变化彼此互不影响时,称为不相关现象
3. 当两个变量之间的关系介于完全相关和不相关之间,称为不完全相关,一般相关现象都是指这种不完全相关
2. 按相关的方向可分为正相关和负相关
1. 当一个变量的取值由小变大,另一个变量的取值也相应由小变大,这种相关称为正相关
2. 当一个变量的取值由小变大,而另一个变量的取值相反地由大变小,这种相关称为负相关
3. 按相关的形式可分为线性相关和非线性相关
1. 当两个相关变量之间的关系大致呈现为线性关系时,称之为线性相关
2. 如果两个相关变量之间,并不表现为直线的关系,而是近似于某种曲线方程的关系,则这种相关关系称为非线性相关
散点图
两个变量间的关系可以用散点图来展示。在散点图中,每个点代表一个观测值,横纵坐标值分别代表两个变量相应的观测值
相关系数
相关系数是度量两个变量间相关关系的统计量。最常用的相关系数是Pearson 相关系数,它度量的是两个变量间的线性相关关系,假设分别可得到两个变量X和Y的n组观测值,即x,y,i=1,2,…,n,其中两组观测值之间是一一对应的,那么Pearson 相关系数r的计算公式为
Pearson 相关系数的取值范围在+1和-1之间,即-1≤r≤1,当|r|=1时,变量Y的取值完全依赖于X
1. 若0<r≤1,表明变量X和Y之间存在正线性相关关系
2. 若-1≤r<0,表明变量X和Y之间存在负线性相关关系
3. 若r=1,表明变量X和Y之间为完全正线性相关
4. 若r=-1,表明变量X和Y之间为完全负线性相关
5. 当r=0时,说明Y和X之间不存在线性相关关系
r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系