导图社区 《乐见数据》书籍学习
《乐见数据》书籍学习,从数据中可以学习到很多东西,作者分享了许多知识内容丰富,欢迎大家下载参考。
编辑于2021-12-19 04:36:28乐见数据
第1章 商业数据可视化原则
1
为什么要学习商业数据可视化?
1.1 温故而知新:重新认识商业数据可视化
商业数据可视化,顾名思义,是针对商业数据的可视化
以更简单、接地气的方式去理解,就是把公司的的业务数据以图表的形式呈现出来。
统计数知识补充:
平均值
最小值
中位数
最大值
标准差
众数
可视化图表
垂直条形图
折线图
散点图
相比单纯的数字,图表可以让人更容易洞察到数据的分布、趋势、关系以及异常点,而这一切的最终目的,都可以归结为四个字——快速决策
1.2 认知重塑:何为好的可视化图表
现状:在大数据时代,每天数以亿计的图表在生产,新闻资讯、公司会议、政府报告、科学实验、商业分析各个角落里的信息,震撼读者的心灵、影响公司的决策、发现科学真理,其余的大多数都会成为过眼烟云。
MECE原则:不重叠、不遗漏
数据可视化是一个技术与艺术共存的领域,除了图表基本的设计理念,我们还需要对商业行为和数据有透彻的理解。
商业战略分析理论
SWOT分析模型
AARRR增长模型
波士顿BCG矩阵
SMART目标管理原则
MECE分析原则
1.3 成功的“秘密配方”:GLAD原则
一个成功的商业数据可视化都要满足两要素
提供足够的商业价值
帮助读者快速理解信息
可视化的目的是洞察,而不是图片绘制。
商业数据可视化是让信息的传递变得更快捷、更廉价
要剔除冗余的信息,精准命中读者的需求,而且要有爆发力,用三个词来概括,就是简洁、准确、突出洞察
GLAD:Good Data and Insight,Less Noise,Accurate Expression,Distinct Mark 乐见数据原则。符合乐见数据原则的就是好的商业数据可视化图表
G:
中文含义:图表的灵魂-发现好数据与好洞察
目标:提升商业价值
可视化应用:探索性数据分析
侧重点:技术
判断性思考问题:数据使用是否恰当?启发、回答、解决了哪个层次的问题?
评价指标:4个层次:描述、诊断、预测、知道
适用工具:EXCEL/BI
L
中文含义:降噪-简洁设计
目标:加快理解信息
可视化应用:解释性数据分析
侧重点:艺术
判断性思考问题:是否有明显的的“降噪”空间
评价指标:信噪比(数据墨水比)
适用工具:excel/PPT
A
中文含义:精准表达——提升数据表达的精准度
目标:加快理解信息
可视化应用:解释性数据分析
侧重点:技术
判断性思考问题:数据信息表达是否准确
评价指标:图形元素精确度数据密度显示效果的精确度
适用工具:EXCEL/PPT
D
中文含义:画龙点睛——突出洞察信息的标识
目标:加快理解信息
可视化应用:解释性数据分析
侧重点:艺术
判断性思考问题:是否突出洞察的标识?
评价指标:15秒法则
适用工具:EXCEL/PPT
1.4 GLAD原则初体验:北京的空气质量改善报告
原图表
建议图表
GLAD评分
GLAD满分图表
第2章 G原则:塑造图表的灵魂
2
我们有一条好消息和一条坏消息。好消息是我们将打造看起来很轻松的图表,坏消息是我们必须付出很大的努力,所以这是一个无法跳跃的章节——你只有很努力才能看起来很轻松。
2.1 认知重塑:探索性数据分析还是解释性数据分析
商业数据可视化的目标是帮助决策者“快速决策”。
在快速决策的过程中,可视化扮演了两个重要的角色
探索性数据分析
探索性数据分析即通常所说的从数据和商业行为中发现价值信息的过程,这其中一般会涉及数据分析的三个常见步骤
数据清洗
洗菜切菜
数据建模
炒菜
数据可视化
上菜摆盘
探索性数据分析中的可视化是以发现洞察为目的,它是数据分析师个人的探索过程或团队内部的工作流程,在这一步的工作重点是对数据的探索而不是对图表的修饰,所以一般不需要精细的图表设计工作,只要能清楚地看出数据的含义有助于继续探索洞察即可,甚至不必在意它们的粗糙、丑陋。
解释性数据分析
当通过探索性数据分析获得了洞察、便推进到了解释性数据分析的环节,即如何把洞察和数据向决策者解释,构思数据报告的逻辑,设计美观的图表并加以修饰,这才是制造完成品的环节。
探索性数据分析的过程往往花费更多的时间,甚至这些时间精力不被人所知,但这些工作是制作好图表的前提;而解释性数据分析可以说是数据分析冰山浮出水面的部分,这个看起来仅仅是图表设计的工作,却是读者将得到的全部信息,也是我们唯一展现分析成果的机会。
商业数据可视化的两大要素
商业价值
探索性数据分析
分析注重内涵
帮助读者快速理解信息
解释性数据分析
分析注重外表
一个成功的图表需要内外兼修
GLAD原则,作为优化图表设计的理念,是两者兼顾的。
“G”在探索性数据分析过程中着重提升图表的商业价值
“LAD”在解释性数据分析中帮助读者加快理解信息的速度
2.2 金玉其外,败絮其中:数据类别和度量指标的选择误区
很多图表的失败不是因为其设计问题,或许我们看这些图表,发现图形选择合适、内容丰富、展示也很清晰,但如果使用了不恰当的数据类别和度量指标,一切努力将化成泡影,无论我们的图表多好看,都没能传递出目标信息和帮助读者解决问题。
什么是商业数据
类别
度量指标
判断一张图表是否用了“好”数据,其实就是看它的数据类别和 度量指标的使用是否恰当
类别的不恰当使用
有重叠
有遗漏
度量指标的不恰当使用
绝对值指标与相对值指标的混淆
时间段指标与时间点指标的混淆
选择一个正确的度量值往往是解决商业问题的关键,现代管理学之父彼得·德鲁克的一条“金句”曾道破度量的重要价值:“如果你不能度量它,就无法改进它”
2.3 做故事的叙述者:描述性分析
我们已经知道了什么是”好“数据,那么如何判断什么是“好”洞察呢?
在探索性数据分析领域,一般将数据分析划分为四类:
描述型
描述型分析是体检,先客观地检查身体健康指标情况,判断是否偏离正常值范围并陈述观点
What(过去发生了什么)
诊断型
诊断型分析即通过进一步的询问和信息挖掘出问题是什么,病根在哪里
Why(为什么)
预测型
预测型分析即结合对病人的了解分析病情目标处于哪个阶段,预测病情会怎样发展
What(未来将要发生什么)
指导型
指导型分析即最后开出针对性的药方和治疗建议
How(应该怎么做)
优秀描述型分析图表
描述事件趋势,融合了关键事件的图表便可以把故事娓娓道来。
2.4 抓住关键少数:诊断型分析
诊断型分析:数据是表象,我们需要从细微的迹象里顺腾摸瓜,抓住数据背后的关键本质,达到一叶落地便知天下秋的能力。
横向扩展、纵向钻取探索验证的方法叫做“抓住关键少数”,因为诊断型分析需要发散思维,我们可能想到几十个店,每个点都需要验证,这个时候更考验的是如何能够抓住关键少数,先锁定关键影响因素的方向,再利用数据逐个缩小范围对比验证,并快速获取业务信息来验证猜想。
2.5 此预测非彼预测:预测性分析
谈到预测,先要清楚地区分两个重要概念
宏观预测 Forecast
宏观预测是对群体的预测,是针对众多商业行为的集合效果做出判断
微观预测 Predict
微观预测是对个人的预测。这类预测一般是基于一个用户当下的数据做出短期判断
商业数据可视化目的是把问题解释给“人“看,传递信息给决策者以知道商业行为。这种方式更适合宏观预测,而不是微观预测
当我们向公司管理层或投资人阐述为什么明年的成本预期下降20%
如果是机器学习给出的答案,这是不具备解释性的。
而宏观预测的逻辑是人基于各项商业行为做判断,可以使用通俗的预演并搭配可视化图表来讲述预测的逻辑。
数据表达和对数据本身的挖掘工作再预测型分析中占有较大的比重,但请不要过于信任软件工具中提供的模拟预测功能,因为软件工具是不懂具体业务的。
优秀预测型分析图表
2.6 向前一步:指导性分析
描述、诊断、预测不是终点而是过程,探索性分析的目标是找到具有指导意义的洞察
指导型分析在很多数据分析教程里也叫做规范性分析
指导型分析其思维可分为
定性
定性需要我们站在高处,以企业经营者的眼光和角度去思考问题,并且提出可落地的执行方案
定量
定量就好像对弈一样,在各种不确定性局面中反复模拟测算,找到最优解。
总结图表
第3章 L原则:降噪
3
发现好数据的确不是一件容易的事,第2章把学习的难度推向了顶峰,不过接下来我们讲把节奏放轻松,因为本章将教授如何剔除多余的东西,即如何把复杂的事情简单化
3.1 认知重塑:商业图表设计的供给与需求
伴随着信息技术的发展,“数据”从概念意识的崛起发展到如今渗透入每一个行业,成为重要的生产要素。
事实上,商业图表的设计需求在过去并未发生什么实质性的变化
如果在艺术领域,想象力是没有上限的。然而商业数据分析不是追求艺术造诣,不是做一张海报去吸引人的眼球,也不是去参加数据可视化大赛。
在商业数据分析领域,读者最大的期望是我们的图表能够提供商业价值并能够快速理解
少即是多
“少”是因为从海量的信息中提炼出稀缺的精华,节省了读者的时间
“多”是它包含了信息含量和商业价值高
3.2 最大化“信噪比”:传递高保真的信息
柱状图
数据信息类:数据图形、数据标签
文字信息类:标题(副标题)、坐标轴标题、脚注
标尺类:坐标轴线、标签、刻度线、网格线
辅助效果类:边框、绘图区背景、图例
数据墨水比
图表中的笔墨要尽可能地展示数据信息,其他信息都应尽可能减少,从而降低对读者的信息干扰。
数据墨水比的公式是图表中用于数据的墨水量/总墨水量
信噪比即信号/(信号+噪声)
最大化信噪比=传递高保真的信息
3.3 再见吧,特效君:小心使用渲染功能
减少特效是笔者关于降噪的第一个忠告
3.4 提升颜值:颜色的使用技巧
在自然界中肉眼能看到的任何色彩都可以由这三种颜色混合叠加而成(RGB)
颜色代表群体的分类
颜色表达数据的大小
颜色以客户为导向
3.5 惜字如金:精准的文字表达
作为图表的重要组成部分,文字内容也应遵循最大化信噪比的要求,所以降噪原则的第三条忠告是“惜字如金”,剔除那些不必要的内容,赋予图表中每一个文字存在的意义。
充分利用大标题
纵坐标轴标题的改造
横坐标轴标题的改造
脚注的必要性
删除重复性词语
修正倾斜标签
字体的使用
有衬线字体
给人一种传统的感觉
无衬线字体
看上去比较轻松
避免复杂的时尚字体
避免斜体和加粗同时使用
避免多种字体混用
避免多余的背景色
优秀精准的文字表达图表
3.6 大胆地砍掉:挖掘降噪的空间
降噪原则的第四条忠告:大胆地砍掉
拆掉“围墙”——边框
砍掉网格线
降低坐标轴刻度密度
标签的力量
第4章 A原则:精准表达
4
可视化所做的工作是把数据故事装入图标中,但如果没有把控好尺度,故事也可能变成“事故”。本章将要提供一把标尺,让我们张弛有度。
4.1 认知重塑:商业数据可视化的游戏模式
输出一张好图表的难点在于它需要制作者拥有三种内容
数据洞察能力
图表设计能力
工具使用能力
数据洞察能力——从探索性数据分析中发现价值信息的能力
数据洞察能力的培养没有什么捷径可言:最好的学习方法是到业务中锻炼,让自己设身处地地站在业务的角度,再结合具体的情况,思考如何提升对数据的敏感度。
图表设计能力——一种运用图表来表达信息的能力
可视化是一门文理兼备的学科,它和演讲、写作一样,都是表达信息的方式,只不过演讲靠的是口才,写作靠的是文字功底,而可视化加入了数据和图表这两个特别的要素。
图形的类别、配色的方式、线的粗细等细节都会影响表达的效果,还需要结合数据、公司、读者、汇报场景等情况去定制化设计,再加上准确地文字阐述和清晰的逻辑结构,这种综合性产品不是只利用某种软件工具就可以直接完成的,它的背后是人类高度复杂的设计思维。
GLAD原则是提升图表设计能力的指导原则。
PDCA是一种有效开展活动的逻辑工作程序,特别是在质量管理中得到了广泛的应用
工具使用能力——把图表设计落地的能力
GLAD原则的目的是提升图表商业价值与加快读者理解信息的速度。
数据洞察越好,商业价值越高
图表设计越简洁、越准确、越突出洞察,读者理解信息的速度就越快
容易模式
像这样定期提供数字报告的工作,讲究效率和准确性,及时、准确地提供固定格式的报告即可完成工作目标,这一般属于容易模式。
Power BI、Tableau
中等模式
中等模式就像命题作文,领导给了一个点或几个点,我们的分析工作围绕这些点来开展。
中等模式下的数据报告属于专项性分析报告,不需要像容易模式下的仪表板一样面面俱到,但难点在于最后输出的结果能否对症下药,精准地回答问题,并能够进一步提出指导意见,说服读者采纳。
相比容易模式,中等模式更能体现业务分析的价值
Excel、PPT
困难模式
困难模式就像无命题作文,它的难点在于没有任何指导方向,大多数情况下我们需要以管理者的身份来思考分析的目标是什么、能帮助业务解决什么问题、我们需要并可以获得哪些资源,对业务和数据有全面深入理解的分析师才能胜任此类任务。
在从数据到洞察的一系列过程中,数据分析师需要结合数据本身选择结合的软件工具
在数据报告的输出上,能够把面和点结合,整体上逻辑清晰,部分上有的放矢
可视化的呈现要充分考虑客户的需求,做定制化设计,如果是以演讲的形式,PPT内容可以精简化,更多侧重在降噪原则的应用上,尽可能降低一张图表的数据密度:如果是以书面报告的形式,可在一定程度上增加数据密度,而且配合更详细的文字解释和辅助说明以应对读者可能会想到的问题。
我们还要考虑报告的读者是在大屏幕、计算机、平板电脑还是手机上阅读。
本章介绍的精准表达原则,将指导我们在可视化工作中做到张弛有度,包括图形元素的精确度、数据的密度、显示效果的准确度。
4.2 治疗选择恐惧症:图形元素的精确度
4.3 重点突出:数据的密度
4.4 差之毫厘,谬之千里:显示效果的准确度
第5章 D原则:画龙点睛
5
5.1 让我快速记住你:15秒法则
5.2 可视化,不欢迎双胞胎:打造视觉反差
5.3 快告诉我答案:绘制神奇的线
5.4 让文字出现在合适的地方:添加巧妙的注释
5.5 新的开始:基于GLAD原则的数据分析报告