导图社区 第三章数据的图表与展示(1)
第三章数据的图标与展示方法和经验
社区模板帮助中心,点此进入>>
项目时间管理6大步骤
互联网9大思维
项目管理的五个步骤
电商部人员工作结构
组织架构-单商户商城webAPP 思维导图。
暮尚正常运转导图
域控上线
产品经理如何做好项目管理
车队管理
python思维导图
数据的图表展示
数据的预处理
数据审核
一手数据
完整性审核
①调查单位或者个体是否遗漏 ②调查项目或变量是否填写齐全
准确性审核
①数据内容是否符合实际 ②数据计算是否有错误
二手数据
适用性审核
时效性审核
确认是否有必要进行加工处理
数据筛选
内容:筛选出符合特定条件的数据
工具:Excel
数据排序
目的:发现数据明显的特征或趋势
数据排序的方法
分类数据的排序
字母型数据(升序降序)
汉字型数据(拼音字母排序或笔画排序)
数值型数据的排序
递增排序
递减排序
数据透视表
作用:从复杂的数据中提取出有用的信息
注意:数据源表中的首行必须有列标题
品质数据的整理与展示
①分类数据和顺序数据是分类整理 ②数值型数据是分组整理 ③低层次数据适合高层次数据的整理显示方法,反之不可
分类数据
过程:计算频数,频数分布表,图形
统计量:频数、比例、百分比、比率
图示
条形图
定义:用宽度相同的条形的高度或长度来表示各类别数据的图形
类别:单式条形图和复式条形图
注:各类别放在纵轴称为条形图 各类别放在横轴成为柱形图
帕累托图
定义:按各类别数据出现的频数多少排序后绘制的柱形图
饼图
主要研究结构性问题
顺序数据
统计量:累积频数、累积频率
环形图
①环形图可以绘制多个样本或总体的数据系列
②环形图用于结构比较研究
③环形图用于展示分类和顺序数据
数值型数据的整理与展示
数据分组:组距分组
要点:①变量值的一个区间作为一组 ②适合于连续变量和变量值较多的情况 ③需遵循"不重不漏"的原则 ④既可采用等距分组也可采用不等距分组
步骤:确定组数(一般5≤k≤15);确定组距;整理频数分布表
相关概念:下限、上限、组距、组中值
等距分组表的分类:上下组限重叠、上下组限间断、使用开口组
频数分布表的做法:插入透视表,点图中三角形, 弹出框中点"值字段设置",将计算类型改为"计数"
分组数据
直方图
定义:在直角坐标系中用横轴表示数据分组,纵轴表示频数或频率,用矩形的宽度和高度来表示频数分布的图形
注:直方图通常是连续排列;宽度通常是固定的
①直方图没有给出具体的数值 ②直方图适用于大批量数据 ③直方图适用于分组数据
折线图
未分组数据
茎叶图
①茎叶图用于显示未分组的原始数据的分布
②树茎为一组数据的高位数值,树叶为一组数据的低位数字
③茎叶图既能给出数据的分布状况也保留了原始数值
④茎叶图适用于小批量数据和未分组数据
箱线图
定义:由一组数据的五个特征值绘制而成,由一个箱子和两条线段组成,用于显示未分组的原始数据的分布的图形
五个特征值:最大值、最小值、中位数、两个四分位数
不同分布的箱线图:左偏分布、对称分布、右偏分布
时间序列数据
线图
定义:在直角坐标系中横轴为时间纵轴为数据,表示时间序列数据趋势的图形
注:一般纵轴数据下段应从0开始,若数据与0间距较大,可采取折断符号
多变量数据
二维散点(两个变量之间的关系)
气泡图(三个变量之间的关系)
雷达图(多个变量之间的关系)用于研究多个样本之间的相似程度
合理使用图表
鉴别图表优劣的准则
①要显示数据,避免歪曲,强调数据之间的比较
②要精心设计、有助于洞察问题的实质
③使复杂的观点得到简明、确切、高效的阐述
④给读者提供的信息是大量的,多维的
⑤阐述数据的真实情况
统计表的设计
①总标题内容应满足3w要求
②表的上下两条横线用粗线,左右两边不封口
③表中的数据一般是右对齐,有小数点的应以小数点对齐,小数点位数应统一
④没有数字的表格单元,一般用"-"表示