导图社区 商业数据分析知识总结与案例分析
商业数据分析知识总结与商业案例应用分析,常见商业数据分析指标,商业分支认知,商业分析的过程和方法、工具与技术等等。一份比较全面的学习商业分析快速入门的基础理论和应用实践的资料。
编辑于2022-07-21 10:53:50商业数据分析
商业分析认知
商业分析定义
商业分析是识别业务需求和确定业务问题解决方案的研究学科
包括战略规划、流程分析,组织变更以及通过数据分析等手段来研究解决问题
商业决策
进入新的领域
开发新的产品
企业组织架构调整
投资并购其他企业
渠道优化
商业分析的四类公司
第三方研究机构
市场分折
用户研究分析
竞争分析
咨询公司
战略投资规划
组织架构调整
市场、竞争和用户研究分析
金融机构
财务、业务分折
股票行情分析
大型企业
公司运营优化
战略投资规划
市场、用户分析
过程和方法
数据收集方法
数据类型
定性数据
分类数据
男女、天气等(不能进行运算)
顺序数据
满意度评分
定量数据
离散型数据
用户数、消费次数等(可以加减)
连续性数据
成绩、消费额等(可以乘除)
统计方法
连续性变量
能做频数分析
集中趋势分析
均值
众数
中位数
离散程度分析
标准差
方差
最大值
最小值
范围
非连续性变量
频数分析
数据收集
分类
隐式数据收集
媒体数据收集
数据埋点
UV/PV
用户数
用户停留时间
用户浏览行为数据
第三方数据统计平台
Growing IO
SimilarWeb
Google Amalytics
国家统计局网站
问卷调查
数据整理
数据异常
空值
数据波动太大
不同数据源获取的数据矛盾
数据异常原因
系统故障
认为因素
数据清洗
删除异常值
对空值进行填充
通过统计模型计算进行填充
不同数据源交叉验证
数据分析方法
对比分析
时间
同比
环比
变化趋势
空间
不同城市对比
不同产品对比
目标
计划目标
用户
不同用户类型
竞品
渠道
功能
体验和流程
推广和收人
分组分析
使用场景
用于数据包含信息多样化,且各种类型的数据之间差异较大 用户分析不同类型数据之间的差异,经常与对比分析方法一起使用
矩阵关联分析
使用场景
当判断某个事物有多重属性时,且各个属性之间没有直接的关联性 需要根据多重属性判断事务结果
矩阵模型
SWOT矩阵
优势
劣势
机会
威胁
波士顿矩阵
市场份额
市场增长率
满意度矩阵
重要性
满意度
逻辑树分析
使用场景
通过将复杂的数据层层拆解,用户发现负责数据中的问题和机会
GMV案例
UV
渠道
SEO
SEM
区域
中国
美国
产品类型
跟团游
机票
酒店
新老UV
新UV
老UV
转化率
渠道
区域
产品类型
客单价
渠道
区域
产品类型
漏斗分析
使用场景
用户发现某个行为路径中的问题
例
用户行为流程统计
产品首页100%
产品详情页75%
加入购物车33%
填写支付信息21%
支付成功11%
工具和技术
A/B测试 (常用于IT行业)
作用
UI内容优化
算法优化
收益优化
新功能效果评估
流程
拆分问题
逻辑树模型
含义
把已明确的问题作为树干
分析哪些问题和树干问题有关
不断向下拓展,把问题拓展成逻辑树
优点
保证解决问题的完整性
理清了所有思路
避免重复和无关的思考
MECE法则
ME:相互独立,有明确区分,不可重叠
CE:完全穷尽,全面,周密,不能有遗漏
二八法则
关注关键问题
舍弃非关键问题
矩阵模型
市场营销
SWOT矩阵
GE矩阵
企业经营
波士顿矩阵
安索夫矩阵
定向政策矩阵
PESE矩阵
产品打造
多角战略矩阵
QSPM矩阵
分析报告
报告展现
PPT母版的运用
设计统一版式
添加logo
批量修改内容
图表展现
表格
提供详实的数据清单
突出页面的重点数据
图表
强化重点数据信息
直观且清晰表达逻辑关系
使用原则
文字提炼原则
言之有物
写简单完整句
配色原则
单色原则
对比原则
IT技术
数据统计/抓取
Python
R语言
数据库/SQL
MySQL
SQL Server
MongoDB
数据挖掘
Hive
大数据
Hadoop
Spark
数据报表
Excel
商业BI报表
PowerBI
Tableau
其他BI工具
大数据分析
神策
数据分析体系
常用分析指标
网站分析指标
UV
PV
点击率
转化率
网页停留时间
网站停留时间
跳出率
退出率
渠道分析指标
新增用户数
用户转化率
渠道ROI
渠道流量
渠道流量占比
活动效果指标
活动点击率
活动参与人数
活动转化率
活动ROI
收入指标
付费人数
转化率
订单数
客单价
GMV
复购频次
毛利率
毛利额
用户类型指标
新增用户
活跃用户
留存用户
回流用户
流失用户
用户价值指标
用户最近一次下单时间
用户下单频次
用户消费总金额
数据分析模块
描述性
预测性
指导性
线下水果销售分析
案例背景
某水果店不同店铺的毛利偏差很大,部分店铺亏损,需要找出亏损原因
问题确认与指标体系
逻辑树业务拆解
利润模型
增加收入
减少成本
问题解决思路
明确问题
拆解问题
量化目标
经营指标体系
单品售价
单品成本
单品销量
单品利润
=(单品售价 - 单品成本) * 单品销量
毛利额
=Σ(单品利润)
是所有商品的利润之和。是没有考虑房租、水电、设备等需要分摊的成本的利润。
毛利率
=毛利额 / 营业收入 * 100%
=毛利额 / Σ(单品售价 * 单品销量) * 100%
GMV
成交金额、订单流水
=Σ(单品售价 * 单品订单数)
SKU
物理上不可分割的最小存货单元
比如一个款式的衣服,有3个颜色,每个颜色都有5个大小,那么这个款式的衣服的SKU就是3*5=15个
固定成本
指在一定时期一定业务量范围内,不受业务量增减变动影响而能保持不变的成本。
比如房租成本,如果没有店面的扩充,我的房租成本并不会随我卖更多品类的货物而变化;类似的有设备成本(除非购入新设备,否则设备成本不会增加),管理员薪水等;
可变成本
可变成本是指在特定的业务量范围内,其总额会随业务量的变动而成正比例变动的成本。
比如生产材料(我业务量越大,生产材料也就越多)、直接人工(我业务量越大,人工的需求也就越多)、按销售量支付的推销员佣金、装运费、包装费,以及按产量计提的固定设备折旧等都是和单位产品的生产直接联系的,其总额会随着产量的增减成正比例的增减。
净利润
指所有收入减去所有支出之后,扣除了税后的利润额。
=(总收入 - 总支出 - 营业税) * ( 1 - 所得税率)
ROI
投资回报率
=销售收入 / 投入成本
计算的是我们销售的收入能够收回我们多少成本。也就是说,如果我们的销售收入能够收回我们的所有成本,这时ROI=1,那么我们就相当于不赔不赚;如果我们的销售收入无法让我们回本,那么我们就相当于赔钱,这时ROI<1;如果我们的销售收入大于我们的投入成本,也就是ROI>1,这时我们做这个投入就能够赚钱。
就是将高低这种相对度量划分出范围的方法。比如我们要找身高高的人,那么将高矮身高的人对比,就能找到高的人。对比分析一般就是将度量单位做划分,比如收入对比,比如体重对比,比如速度对比等等;
制定方案
目标评估
实验
分析实验结果
分组分析
分组分析是将有相同特性的个体划分到相同组,从而分析组内个体的特征和组间个体或群体特征的方法。
对比分析
矩阵关联分析
如果对比涉及多个度量维度,那么我们但意思值的对比分析就不再适用。这时,我们就需要适用矩阵关联分析。比如我们需要在销量和毛利率的双重考量下寻找优先生产的商品,比如我们需要在用时和收益的双重考量下判断我们优先完成的工作等等;
趋势分析
趋势分析,就是判断某类指标近期的走势的方法。简单的趋势分析就是判断一个指标的上涨和下降的趋势,比如判断自己的体重是否会上涨;比如判断自己的收入是否会上涨;而复杂的趋势分析,则会从模糊的判断数据变动方向,逐渐精确至数据的涨幅或者跌幅,复杂的分析方法,一般都是为了提高预测精度的。
结案报告
实际方法应用
Excel方法
高级筛选
能够实现复杂的筛选功能,有时排重的功能也能使用高级筛选实现。
数据表格美化
sumif
按单一条件计算累加数据
sumifs
按多条件计算累加数据
counta
对非空单元格计数
countifs
按多条件计算计数
min
求一个范围内的数据的最小值
max
求一个范围内的数据的最大值
average
求一个范围内的数据的平均值
数据透视表
能够实现列联表统计的功能
在线教育机构经营分析
案例背景
分析某在线课堂的经营指标,找到不同渠道的人群转化率和用户留存
问题确认与指标体系
逻辑树业务拆解
利润模型
增加收入
减少成本
问题解决思路
明确问题
拆解问题
量化目标
经营指标体系
单品售价
单品成本
单品销量
单品利润
=(单品售价 - 单品成本) * 单品销量
毛利额
=Σ(单品利润)
是所有商品的利润之和。是没有考虑房租、水电、设备等需要分摊的成本的利润。
毛利率
=毛利额 / 营业收入 * 100%
=毛利额 / Σ(单品售价 * 单品销量) * 100%
GMV
成交金额、订单流水
=Σ(单品售价 * 单品订单数)
SKU
物理上不可分割的最小存货单元
比如一个款式的衣服,有3个颜色,每个颜色都有5个大小,那么这个款式的衣服的SKU就是3*5=15个
固定成本
指在一定时期一定业务量范围内,不受业务量增减变动影响而能保持不变的成本。
比如房租成本,如果没有店面的扩充,我的房租成本并不会随我卖更多品类的货物而变化;类似的有设备成本(除非购入新设备,否则设备成本不会增加),管理员薪水等;
可变成本
可变成本是指在特定的业务量范围内,其总额会随业务量的变动而成正比例变动的成本。
比如生产材料(我业务量越大,生产材料也就越多)、直接人工(我业务量越大,人工的需求也就越多)、按销售量支付的推销员佣金、装运费、包装费,以及按产量计提的固定设备折旧等都是和单位产品的生产直接联系的,其总额会随着产量的增减成正比例的增减。
净利润
指所有收入减去所有支出之后,扣除了税后的利润额。
=(总收入 - 总支出 - 营业税) * ( 1 - 所得税率)
ROI
投资回报率
=销售收入 / 投入成本
计算的是我们销售的收入能够收回我们多少成本。也就是说,如果我们的销售收入能够收回我们的所有成本,这时ROI=1,那么我们就相当于不赔不赚;如果我们的销售收入无法让我们回本,那么我们就相当于赔钱,这时ROI<1;如果我们的销售收入大于我们的投入成本,也就是ROI>1,这时我们做这个投入就能够赚钱。
运营指标体系
获取
渠道指标
新用户数
一般是当日新设备数。对于现在的移动互联网环境来说,我们可以说一个用户有多个手机设备,但是一般一个手机设备,基本是属于单一用户的,共用情况会比较少。所以,我们一般将每日新增的设备数,算作我们的新增用户数。那一般我们怎么能判断这个设备是新的设备呢?一般企业会建立一个历史设备库,保存历史所有用户的设备号,如果新来的用户的设备号没有出现在历史设备库里,那么就能判断这个用户是一个真的新用户
渠道成本
一般渠道分为广告、应用市场、自媒体推广、社群。渠道成本,则是我的广告投放费用,应用市场买量费用,自媒体推广费用,社群活动费用。
渠道ROI
渠道ROI,一般用渠道获得的所有用户的生命周期内所贡献的所有价值 / 渠道成本
激活
用户活跃指标
新增用户数
一般是当日新设备数。对于现在的移动互联网环境来说,我们可以说一个用户有多个手机设备,但是一般一个手机设备,基本是属于单一用户的,共用情况会比较少。所以,我们一般将每日新增的设备数,算作我们的新增用户数。那一般我们怎么能判断这个设备是新的设备呢?一般企业会建立一个历史设备库,保存历史所有用户的设备号,如果新来的用户的设备号没有出现在历史设备库里,那么就能判断这个用户是一个真的新用户
DAU
指日活跃用户数。首先是活跃指标,对于app来说,一般用户当日有打开app的行为,这个用户就会被算作活跃用户。我们计算一天的活跃用户排重的个数,即可得到DAU的数据。
MAU
指月活跃用户数。指一个月的活跃用户的排重个数。
PV
页面浏览数。一般来说,一个页面打开一次就会有一次PV,一个页面刷新一次也能有一个PV。
UV
独立访问用户数(注意UV的英文为Unique Viewer,而不是user value之类的)。一般会对某个页面或者某个功能点求UV,基本就是计算这个页面的访问用户排重数据,或者这个功能点的访问用户排重数据。
到达率
比如一个邀请类的活动,到达率的计算就是接受邀请的用户数 / 给发了邀请的用户数
跳出率
指仅访问了入口就离开的访问量与所有访问量的百分比
页面停留时长
指用户在访问一个页面之后在这个页面停留的时间
浏览深度
一般指一个用户浏览网站的页面数,浏览页面数越多,浏览深度也就越深。
留存
留存率
次留
留存这个概念是指某一天访问过的用户在之后几天的回访情况。我们一般会将那一天设置为“基准日”,次留则是指基准日的次日(之后的第一天)回访的用户数。回访日期 - 基准日期 = 1
次日留存率 = 次留数 / 基准日用户数 * 100%
2日留
指基准日访问的用户数中,在基准日二天之后的那天回访的用户数。回访日期 - 基准日期 = 2
2日留存率 = 2日留用户数 / 基准日用户数 * 100%
3日留
指基准日访问的用户数中,在基准日三天之后的那天回访的用户数。回访日期 - 基准日期 = 3
3日留存率 = 3日留用户数 / 基准日用户数 * 100%
……
n日留
指基准日访问的用户数中,在基准日n天之后的那天回访的用户数。回访日期 - 基准日期 = n
n日留存率 = n日留用户数 / 基准日用户数 * 100%
留存的理解
留存的理解中,比较困难的点在于
1.回访用户数
理解留存,首先需要理解回访用户。回访的用户,就是说我在基准日有活跃,之后在回访日又再次活跃的用户。可以用基准日和回访日的用户交集来表示这个用户群体。
2.不同类型用户留存
很多同学对留存的概念局限于新用户留存。其实留存这个概念可以拓展到很多场景,比如活跃用户留存,比如某个特殊页面的用户留存,或者某个UP主的粉丝留存;
3.2日留是基准日两天后的那天的留存,要注意有时会对“第二日留存”产生误解。
因为第二日很容易理解成基准日后的第一天,也就是基准日的明天。但实际上2日留存计算的是基准日两天后的那一天的数据,相当于是算基准日的后天的数据。
转化
购买转化率
指某个范围用户中实际购买的用户比例。在这里,分子基本都是购买的用户数,而分母会依据范围的选取有变化。比如计算商品页面的购买转化率,我们会用浏览商品页面的用户数作为分母;比如计算某个按钮的购买转化率,我们会以点击这个按钮的用户数作为分母
客单价
指每个顾客平均购买的金额
复购率
指在首次购买之后又来购买的用户数
复购率与留存率有一定相似之处,都是计算在某个时间段做了某个行为的用户数与在之后某个时间段又做了这个行为的用户数的比;其差异性为:复购一般以购买为计数标准,而留存一般以活跃为计数标准;留存率一般用日为单位计算,而复购率一般以月为单位计算
裂变
制定方案
目标评估
实验
分析实验结果
逻辑树拆解
指按数据构成将一个聚合指标拆解成个体指标或者子群体指标。然后通过分析子群体指标的特点来定位问题
综合分析
漏斗分析
用户在从圈定到达到某个目标的过程中,会在各个环节逐渐流失。漏斗分析则是按照用户流失的环节设计流失漏斗,观察各个环节的用户流失率。之后通过对比分析或者拆解分析法分析流失率较低的环节里出的问题
比如某视频网站,从用户打开APP到用户观看完第一个视频,中间可能有几个环节:打开APP-首页曝光-视频详情页曝光-视频播放按钮点击-广告播放-视频播放-播放完成。其中每个环节都存在用户流失,我们观察各环节的用户流失率,就能发现一些流失率不太正常的环节。之后经过一些逻辑树拆解法定位具体问题
分组分析
分组分析是将有相同特性的个体划分到相同组,从而分析组内个体的特征和组间个体或群体特征的方法。
指标体系模型
通过建立综合指标评估体系来综合评估个体;比如一些卡牌游戏,通常都有多个属性值,一般来说并不是某个单一属性值越高越好,想要找到一些好的卡牌,往往都需要综合几个指标来衡量
对比分析
就是将高低这种相对度量划分出范围的方法。比如我们要找身高高的人,那么将高矮身高的人对比,就能找到高的人。对比分析一般就是将度量单位做划分,比如收入对比,比如体重对比,比如速度对比等等;
矩阵关联分析
如果对比涉及多个度量维度,那么我们但意思值的对比分析就不再适用。这时,我们就需要适用矩阵关联分析。比如我们需要在销量和毛利率的双重考量下寻找优先生产的商品,比如我们需要在用时和收益的双重考量下判断我们优先完成的工作等等;
趋势分析
趋势分析,就是判断某类指标近期的走势的方法。简单的趋势分析就是判断一个指标的上涨和下降的趋势,比如判断自己的体重是否会上涨;比如判断自己的收入是否会上涨;而复杂的趋势分析,则会从模糊的判断数据变动方向,逐渐精确至数据的涨幅或者跌幅,复杂的分析方法,一般都是为了提高预测精度的。
结案报告
实际方法应用
Excel方法
高级筛选
能够实现复杂的筛选功能,有时排重的功能也能使用高级筛选实现。
数据表格美化
sumif
按单一条件计算累加数据
sumifs
按多条件计算累加数据
counta
对非空单元格计数
countifs
按多条件计算计数
min
求一个范围内的数据的最小值
max
求一个范围内的数据的最大值
average
求一个范围内的数据的平均值
数据透视表
能够实现列联表统计的功能