数据分组
概念
数据分组:根据统计研究的需要,将原始数据按照某种标准分成不同的组别,分组后的数据称为分组数据
组距分组:它是将全部变量值依次划分为若干个区间,并将一个区间的变量值作为一组,组距是一个组的上限与下限的差,组中值=(上限值+下限值)/2
数值型数据的图示:直方图(展示数据分布) 茎叶图(展示原始数据分布) 箱形图(原始数据分布特征) 线图(现象随时间变化的特征) 雷达图(显示对比多个变量) 散点图(展示两个变量之间的关系) 气泡图(三个变量,两个变量通过坐标轴展示还有一个变量通过气泡的大小展示)
直方图和条形图的区别:(1)条形图是用条形的长度(横置时)表示各类别频数的多
少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。 (2)由于分组数据具有连续性,直方图的各矩形通當是连续排列:而条形图则是分开排列。 (3)条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
茎叶图和直方图的区别:茎叶图给出数据的分布状况,又能给出每一个原始数值(保留了原始数据的信息),直方图只能显示数据的分布。直方图适用大批量数据,茎叶图适用小批量数据