导图社区 CDA Level1教材笔记
这是一篇关于CDA Level1教材笔记的思维导图,知识点全面,内容详实,希望能帮助你
编辑于2023-11-01 00:52:08CDA Level1
1.概述&P360/8.CDA职业发展
1.1数据分析概述
1.1.1分类
1.1.2基本流程
1.1.3落地方法
1.2数据分析师
1.2.1不同角色与职责
1.2.2职业道德和行为准则
P360/8.CDA职业发展
8.1概述
8.1.1背景
8.1.2特点
8.1.3前景
8.2认证简介
8.2.1标准
8.2.2方式
8.2.3流程
8.2.4证书
8.3持证人与会员
8.3.1成为CDA会员
8.3.2CDA持证人权益
8.3.3年检和继续教育
1.3数据相关的安全与立法
1.3.1各国的数据隐私相关法律
1.3.2我国大数据立法的历程和展望
2.表格vs表(结构数据)
数据的主要2类别:结构化数据vs非结构化数据
是什么?P18
结构化数据
非结构化数据
主要来源是?例如有哪些?
主要应用的IT工具有哪些?
结构化数据展开:概述、特征、获取及分析方法
2.1&2.2表格结构数据(是什么、处理工具、特征、应用基本方法)
基本引用、计算单位:单元格
2.1.1概述
概念
电子表格:Excel、Numbers、WPS
2.1.2特征
1.具有层级关系。
(1)几个层级结构的基本概念
单元格
单元格区域
工作表
工作簿
(2)层级结构——父子级关系
①概念
②满足2条件:省份及市、订单与订单详情、品牌与产品
2.可以为不同的单元格设置不同的数据类型,但是一次只能为一个单元格设置一种数据类型。
(1)数据类型3分类:数值型、文本型、逻辑型
(2)根据数据类型对应的数据值(是什么?作用?注意点?)
①数值值
A.作用:计算
B.包含
a.整数值
b.小数值
②文本值
A.用途:文本描述
B.包含:文字、符号、数值等
C.基本概念
单一字符
字符串
D.注意:文本值里面的数字,若要处理计算,则与数值值计算处理不同。
③逻辑值
A.用途:逻辑判断
B.只包含
a.真值(true):可以用非零的数值进行替换
b.假值(false):可以用数值值0进行替换
3.一个单元格不仅具有数据类型的属性,还具有单元格格式的属性。
单元格格式的属性的作用:让用户更加清晰、直观地理解数据信息
2.2.1获取
1.主要3个来源
(1)企业的后台数据库系统
2.获取数据库数据委托流程P25图2-5
(1)分析人员在向数据库管理人员提需求时应尽量做到4点
(2)企业的前端操作平台
3.优缺点:P26第3段
(3)企业的外部渠道
4.常见情况&注意点P26第4段
2.常见的电子表格工具支持的数据文件主要有2种形式P26:分别是什么?主要3区别点
(1)文本文件:CSV文件 vs TXT文件
扩展名
分隔符
数据信息
(2)电子表格工具文件:WPS、Excel、Numbers
(3)2种形式数据文件3区别点
①操作及记录
②限制
③电子表格工具支持度
2.2.2应用表格的基本方法
表格结构数据的基本处理单位:单元格
2.2.2.1引用
1.定位
列(字母)——A至XFD共13684列
行(数字)——共104,8576行
2.引用方法
(1)单元格值
①表格内引用
=A1
②同一文件不同工作表引用=引用其他工作簿中的单元格进行计算=引用其他工作表中的单元格进行计算
=Sheet2!A1
错误例子
Sheet2?B3
Sheet2&B3
"Sheet2:B3"
(2)单元格区域
①A1:C4
②要满足2条件
A.连续
B.方形区域
数组
③注意点
正确例子
4:9
B:H
A1:D5
错误例子
F3:A1
A8:20
④引用其他工作表
工作表名!4:9
可以进行单元格区域之间的计算
2.2.2.2查询
1.查询特定值的2个方法
(1)搜索——步骤
同时按“Ctrl+F”
弹出“查找和替换”
输入“要查的内容”
(2)利用函数
1.函数的认识
构成6部分
(1)=
(2)函数表达式
(3)参数
(4)操作符
(5)返回值
(6)数值值
复杂计算要嵌套
2.2.2.3计算
1.计算方法
(1)直接计算P36表2-3《常用运算符示例》
(2)函数计算P36表2-4《Excel、WPS表格中常用函数示例》
3类型:查找类函数、数学类函数、文本类函数
筛选器类函数不属于它
需记忆点
文本函数:LEFT
日期函数:DATE
查找与引用函数:VLOOKUP
统计函数:COUNT
2.3&2.4表结构数据
2.3.1概述&P46/2.4.2数据库与商业智能的概念解析
1.基本单位
字段
文本型字段——例如维度字段
数值型字段——例如度量字段
记录
2.重要几个概念P38
维度
度量
维度表
事实表
2.4.2数据库与商业智能的概念解析
关系数据库管理系统(RDBMS)
主要任务:企业业务数据的存储、检索、访问与共享
核心定位:OLTP(联机事务处理)
地位:联机事务处理系统(OLTP)的一个重要环节
BI系统的功能=OLTP(含RDBMS)+ETL+数据仓库+OLAP+数据可视化
数据库(DB)
数据表(Table)
商业智能系统(Business Intelligence,BI)
BI系统的功能=OLTP(含RDBMS)+ETL+数据仓库+OLAP+数据可视化
OLTP
前述:关系数据库管理系统(RDBMS)
DBMS
用来管理数据库的软件,对数据库进行统一的管理和控制,以保证数据库的安全性。
ETL
功能
抽取+转换+加载
不包含:分析
执行顺序
每个功能介绍(表示、作用、每个作用特点)
(1)"E"
(2)"T"
(3)"L"
数据仓库(DW)
vs数据库(DB)
联机分析处理(On-Line Analytic Processing,OLAP)
多维数据模型工具功能定位
分类(服务对象范围+使用目的)
(1)企业级商业智能系统
(2)敏捷型商业智能系统
两种分类比较
应用范围P48表2-5
主要IT厂商
主要处理工具:Power BI、Mysql、SPSS、DB2
2.3.2特征
1.表结构数据中的基本引用、操作、计算单位是字段或记录行。
(1)在表结构数据中,很难对某一特定单元格值进行单独的处理与分析,至少影响一整列或一整行;
(2)几个重要概念及特点
字段名
字段的第1行/表结构的第1行
同一个表不能出现2个以上有相同字段名的字段
标题行
=有所有字段名构成的表中的第1行
(3)表中1个字段只能有1种数据类型。
(4)一行记录可以有不同数据类型
2.在表中所有字段的记录行数相同。
null(空值/缺失值)
描述
影响计算精度
一个表中的字段名不能重名
是为在表中所有字段的记录行数相同而存在的
不同表中的记录可以合并在一起
计算机无法确保计算结果
阅读者无法理解
可能由前端系统非必填项产生
可以删除
缺失值处理
(1)原因:避免含空值的记录行影响整体的分析精度。
字段中可以有null值
错误说法:任何一个字段都可以出现空值。
主键字段非空不重复
(2)根据字段数据类型的不同,缺失值处理方法如下:
①影响不大,用“-”替换null值
②.影响重要,与信息录入者确认
A.若该人员无法确认&认定不具有实际业务意义(无效/无意义)
删除
B.有效信息
替换null值
③综合考虑:度量意义&针对该数值型字段进行汇总计算的方式
错误说法:不同字段的行数可以不同
3.几乎所有数据表中都存在且只存在一个主键。
主键
(1)存在的意义
①物理意义
主键的物理意义:表的行识别符
A.几个概念
非空
不重复
单字段主键
多字段联合主键
主键可以由多个字段构成
错误说法:主键只能是一个字段
B.注意点
a.一个数据表只能存在一个主键
定位:字段名+主键值
b.表中的字段名是唯一的
c.主键一定是非空和不重复,即不能有null键和不能有重复值
②业务意义
A.表的业务意义:一个表的业务记录单位
B.分析人员需要充分了解表中每行记录生成的依据、判断记录信息的业务范围、正确使用
C.识别与确认字段的3种方法
a.SQL语言直接操作
b.咨询设计者或翻资料
c.非空+不重复
但不一定
P70多选5.某电商订单表中的主键为订单号,根据业务尝试判断不能存放于订单表中的字段是( ) A.客户ID B.产品名称 C.付费时间 D.产品金额
答案:BD
解析:一个订单可能存在多个产品,如果存放产品名称字段会破坏主键约束,同样的,产品金额也不可以,订单金额是没有问题的。
2.4.1获取
与表格获取无差异
可以成为表结构数据数据源的有
CSV格式的数据文件
数据库
Excel文件
网页数据
与表格的功能区别:应用vs引用
表结构分析工具获取其他数据源的方式:引用
2.4.3&2.4.4引用基本方法
2.4.3合并
合并方式:横向合并vs纵向合并
横向合并方式
前提条件/“连接桥梁”:公共字段=匹配(mate)=具有相同的记录值
公共字段的辨析P70复合题(1)
合并结果的决定3个属性
(1)方向性
(2)主附关系
决定性的3种连接方式,向谁谁为主、对内皆平等、无论怎连接、还需看合并后共有行数(P57/图2-29、P70/复合题(2))
①左连接:left join
②右连接:right join
③内连接:inner join
(3)对应关系
决定因素:重复值
多表
一般是将非主键字段作为公共字段使用的表
一表
一般是将主键作为公共字段使用的表
两表连接3种对应关系
一对一
多对多
一对多/多对一
它是决定两表连接结果行数的=两表公共字段匹配记录值乘积的结果(P57图2-29)
在实际工作中,一般应尽量选择一对多的对应关系进行连接。
E-R图(Entity Relationship Diagram,实际关系图/“鸟瞰图”)
标识
连接线标识“1”
连接线标识“*”
纵向合并方式P59
主要2种合并方式
(1)去重合并
SQL命令:union
(2)全合并
SQL命令:union all
满足2个条件,P60图2-32&倒数第2段举例
(1)字段数
(2)字段数的数据类型
2.4.4汇总
数据透视分析方法P61
4步骤
结果=维度*度量*汇总计算规则
度量用来描述业务结果程度
维度
描述
业务观测角度=描述业务不同侧面
业务行为结果
维度筛选度量
错误说法:度量筛选维度
几个概念
①维度字段(又称分类字段)
②汇总计算规则(又称聚合规则)
③筛选
汇总计算规则
5种常用的汇总计算规则
①合计规则:sum
②计数规则:count(非空计数)/distinctcount(去重计数)
③平均规则:average
④最大值规则:max
⑤最小值规则:min
业务意义
数据分析的意义
2类分析方法
①数据透视分析方法
本质:业务描述性分析
②数据挖掘方法
Level2和Level3内容
内容=描述性分析+预测性分析
How to do better?
步骤
step1 选对维度=业务需求=业务角度
step2 找全相关维度数据
举例
step1 观测销售问题
step2 找全销售业务涉及的数据
①产品维度
②客户维度
③渠道维度
④销售人员维度
⑤市场维度
⑥售后维度
⑦其他
3.数据库
3.1相关概念
3.1.1&3.1.2简介及认识
3.1.1数据库简介
1.什么是数据库?
数据库
2.分类
1)关系数据库P72
主流关系数据库
从公司分
IBM公司
DB2
Oracle公司
Oracle
MySQL
微软公司
SQL Sever
从企业规模、业务量分
适用于大型企业
DB2
Oracle
适用于中型企业
Oracle
SQL Sever
适用于小型企业
MySQL较普遍
SQL Sever
成本、速度、运行稳定、安全和性能、可扩展性、适用环境等考虑
2)非关系数据库P73
主流工具:MongoDB、HBase
功能
DBMS(数据库管理系统)
学习工具:Mysql
关系
数据库管理系统&数据库&表&字段&“记录+字段名” =超市仓库&货架&纸箱&产品
3.1.2认识数据库
1.数据库数据处理流程
2.数据库整体框架
3.数据库、数据库管理系统和SQL之间的关系
3.1.3 SQL
1.分类及应用-DMQC
2.特点
1)书写要求
2)注释
3.1.4数据仓库
3.1.3 SQL
SQL的4类操作类型:DMQC
作用、基本操作
3.2数据定义语言(DDL)
3.2.1作用
基本操作
3.2.2定义数据库
主要操作语言有:create、alter、drop、use
(二)数据表
1.数据字典
2.创建表
3.查看表
4.修改表
3)修改字段类型
alter table<表名>modify<字段名><新数据类型>;
5.删除表
3.2.3数据表
3.2.4数据类型P88
1.定义数据类型
2.数值型
1)整数型:INT
可以对其使用SQL函数的有:round、max、abs
2) 小数型:FLOAT、DECIMAL
3.字符串型——代表文本数据类型
CHAR
可以对其使用SQL函数的有:concat(组内分组、处理字符串数据)
4.日期时间型
3.2.5约束条件
1.定义约束条件
完整性约束条件包含
1.Primary Key:主键约束
2.Unique:唯一约束
3.Auto Increment : 自动增长约束
4.Not Null :非空约束
5.Default : 默认约束
很少接触
6. Foreign Key :外键约束
7. Check : 检查约束
3.3数据操作语言(DML)
3.3.1作用
属于DML操作语言有:insert、update、delete
基本操作
3.3.2添加数据
add:添加字段命令
注意点:3个一致(个数、顺序、数据类型)
(1)个数
字段的个数和添加的数据取值个数必须一致
(2)顺序
字段的个数和添加的数据取值顺序必须一致
(3)数据类型
字段的个数和添加的数据取值数据类型必须一致
3.3.3将查询结果添加到表中
3.3.4修改/更新数据
update<表名>set<字段1>=<值1>:修改更新表中数据命令
update student set age=age+1
3.3.5删除数据
delete from+表名
删除表中所有数据但保留表结构的命令
truncate+表名
3.4数据查询语言(DQL)——基本操作
3.4.1单表查询
1.关键词
all:满足所有条件
and:且
in
某数据库中t1表有city字段,在以下语句中能查询t1表中 New York 和 Los Angeles 的相关记录
=select *from t1 where city_name="New York" or city_name="Los Angles"
=select *from t1 where city_name in ("New York","Los Angles")
=select *from t1 where city_name in ("New York","Los Angles")
where
别名不能用于where的句子中
where是不可以出现在有聚合函数的句子中,where子句中不能用聚合函数
where 子句应该在group by子句之前
P106表3-10
2.基础查询语句
1)常用值
2)公式
3)表达式
4)字段名
5)*(星号)
6)去重
distinct P110
①与like比较
②基础语法格式
必须位于第一个字段前,多字段间用逗号隔开
错误的表达:
SELECT StudentID,DISTINCT Class FROM student;
正确的表达式:
SELECT DISTINCT StudentID FROM student;
去重1个字段:SELECT DISTINCT <字段> FROM <表名>;
SELECT DISTINCT StudentID,class FROM student;
去重多个字段:SELECT DISTINCT <字段1>, <字段2>,... <字段n> FROM <表名>;
SELECT COUNT(DISTINCT StudentID)FROM student;
DISTINCT在()去重:SELECT COUNT(DISTINCT StudentID)FROM student;
Student表中记录了同学每一次考试,Student ID 字段取值不会出现重复的取数结果命令是:
select StudentID,max(score) from student group by StudentID;
7)设置别名
别名不能用于where的句子中
列别名通常出现在SELECT子句中(范围更大)
3.条件查询
1)单一条件查询
2)多条件查询
3)连续范围查询 P114
between...and...
......>=....and......<=......
4)空值查询
5)模糊查询 P115
like'%a%'
4.查询结果排序
order by
如果指定了多个字段则,则按从左至右依次排序,前一个字段取值相同时,再按后一个字段排序。
5.限制查询结果数量
6.聚合函数
P121 有:count、sum、avg、max、min
where是不可以出现在有聚合函数的句子中
正确使用:
count(*)
min(sal)
max(sal)
sum(sal)
例子
检索销量表中销量最好的商品id和销量的SQL命令:
SELECT 商品id,销量 FROM 销量表 WHERE 销量 =(SELECT MAX (销量) FROM 销量表 )
查询没有参加考试的学生名单
假定学生信息表student、课程信息表course 、学生选课表sc
7.分组查询
3.4.2函数
1.数学函数 P127/表3-14常用的数学函数
(1)abs(x)
(2)sqrt(x)
(3)round(x[,d])
可以完成四舍五入
2.字符串函数
(1)concat/ P128
3.日期时间函数 P133/表3-16
now是返回当前的日期及时间的函数
3.4.3多表查询 P142
1.纵向合并查询
union
合并后的数据集行数是合并前的总行数
2.横向连接查询
1)对应关系
(1)一对一关系
(2)一对多关系
(3)多对多关系
2)连接方式 P146——以对student1和student2两个表进行连接后,形成新表的表现
(1)inner join:内连接
不一定包含student1中的所有行,不一定包含student2中的所有行
应知道查询结果有( )行
(2)left join:左外连接
一定包含student1中的所有行,不一定包含student2中的所有行
练习题:数据库中有两张表,users表中有三个字段(user_id,user_name,create_at),orders表中有三个字段(order_id,user_id,amount)。查询users表中存在orders表中不存在的user_id。
select users.user_id from users left join orders on users.user_id=orders.user_id where orders.user_id is null
(3)right join:右外连接
不一定包含student1中的所有行,一定包含student2中的所有行
(4)union:全外连接
不一定包含student1中的所有行,不一定包含student2中的所有行
(5)from:自连接查询
(6)多表连接
(7)from/cross join:交叉连接
3)连接条件
on关键词实现两表之间的关联,在连接查询时,建立连接的公共字段可以有一个或多个
查询关键词中能保留被连接两表的全部信息的是:full join 、union all
3.4.4子查询
错误说法:所有的子查询都可以替换为连接查询
当where子句的查询条件是聚合函数时,子查询不能替换连接查询。
子查询必须放在圆括号里
子查询可出现在SELECT、WHERE、having、FROM、JOIN的句子中
3.5视图
3.5.1视图的作用
基本操作
3.5.2创建
3.5.3修改
3.5.4删除
几个命令总结
1.删除
删除数据:delete from vs truncate P104
delete from <表名>[where 删除条件]
删除表中所有数据但保留表结构的命令
truncate
(1)执行速度比delete快
(2)删除表中全部数据
drop:删除数据库P81、字段(与alter结合)&表P87、视图P170
clear:清除SQL语言和结果窗格,删除所有数据
remore暂时未见
限定符: <表名>.<字段名>
NOT IN用法:
产品类型!='a' and 产品类型!='a'
子主题
4.描述性统计分析
4.1 统计学概述
4.1.1 统计学的定义及应用
统计学是一门围绕数据的科学。
数据清洗的工作属于统计学的处理数据环节。
统计学的数据分析4个环节:
收集数据
处理数据
分析数据
解释数据
统计学的数据分析4个环节讲解
收集数据
数据来源
调查vs实验
数据抓取vs数据爬取
处理数据
包括工作
数据清洗岗位
4.1.2 统计学的基本概念
1.总体vs样本
总体
样本
2.参数vs统计量 P187/表4-1
参数
统计量
3.变量vs数据
变量
数据
4.2 数据的描述性统计分析
4.2.1 集中趋势描述
1.分类数据的集中趋势描述
众数
当有变量的少数数据缺失,那么缺失值可以使用其填充
2.顺序数据的集中趋势描述
二分位数/中位数
在进行缺失值填补时,若数据呈明显的偏态分布,可以考虑使用其填充
四分位数
用于描述定序型变量(如教育水平)离散程度
3.数值数据的集中趋势描述
算数平均数
计算
调和平均数
几何平均数
平方平均数
4.2.2 离散程度描述
1.分类数据的离散程度
异众比率
2.顺序数据的离散程度
1.极差
2.四分位差
不受极端值影响
3.数值数据的离散程度
1)平均差
2)方差、标准差 P205
计算
3)离散系数
离散系数越大,样本数据更分散,离散系数越小,说明数据离散程度小、分布较集中,更具代表性。
计算
为了检验工艺是否有效,将进行t检验,通常在t检验之前首选进行F检验,判断两个总体的方差是否存在显著的差异。
4.2.3 分布形态描述
1.偏态:偏度大于0,右偏;偏度小于0,左偏;偏度=0,无偏;
2.峰态:峰度大于0,分布更尖,尖顶型;峰度小于0,分布更扁平,平顶型;偏度=0,与正态分布一致;
4.2.4 描述性统计图表
1.整理数据的重要工具——统计表
2.展示数据的重要工具——统计表
4.3 常用的数据分布
4.3.1 两点分布vs二项分布
1. 两点分布
2. 二项分布(伯努利分布) P220
期望E(X)=np,方差Var(X)=np(1-p)
4.3.2 正态分布vs标准正态分布
1.正态分布
2.标准正态分布
4.4.3
分布(卡方分布)
4.3.4 t分布(学生氏分布)
4.3.5 F分布
4.3.6 分位点
4.4 相关分析
4.4.1 含义
4.4.2 简单线性相关关系的描述
4.4.3 简单线性相关关系的度量
1. Pearson相关系数
2. Spearman等级相关系数
3. 使用相关系数时需要注意的问题
练习题:一家企业科研投入与专利产出的相关性描述为:皮尔逊相关系数=0.03、显著性(P值)=0.76
说明:专利产出与科研投入相关性不显著
5.多维数据透视分析
考点
ER关系图
1.雪花模型
事实表+展开+多维度:使用订单表、产品表与品牌表构成多维模型
1个事实表+1个维度表+1个维度表
2.星座模型
多个事实表共用某些维度表
3.星型模式
1个事实表+多个维度表
例子:订单明细表、产品表、员工表/客户表
事实表vs维度表
事实表:销售表、订单表、订单详情表、产品库存表
维度表:客户信息表、产品信息表、品牌信息表
维度表与维度表之间是不存在关系的
例如:客户表&销售人员表
对应关系
多对一:产品表&品牌表、产品表&产品子类别表
透视计算描述
①以多表为主表
②以一表为维度表
一对多:客户表&订单表
跨表筛选应满足的逻辑:维度与公共字段是父子级关系
度量使用的字段:购买数量
可以连接在一起的表
①订单表&订单详情表
②销售表&客户表
③产品表&产品尺码表
课本内容
5.1 多维数据模型
5.1.1 概述
5.1.2 创建方法
在多表链接环境下,维度表和事实表构成3种不同的连接模型
(1)星型模型:1事实表+多维度表
(2)雪花模型:1维度表&2维度表+事实表
(3)星座模型:多事实表+多维度表
5.2 5W2H思维模型
5.2.1 概述
每个字母含义
W(参与角色): Who
W(对象):What
W(为什么分析): Why
W: When
W: Where
H(度量值): How much
H(解决方案): How to do
5.3 多为数据透视分析应用案例
5.3.1 业务场景介绍
5.3.2 案例设计制作过程
6.业务分析方法
考点记录
数据驱动型业务描述:
错误:
数据为主,经验为辅
数据比经验更可信
“人货场”业务模式
“场”相关数据
订单表
订单明细表、订单详情表
描述销售人员业绩情况好坏的指标
同比增长率
目标比差异百分比
5W2H
步骤
将业务场景进行概括总结
将总结内容梳理为业务维度
将业务维度梳理为数据表
将数据表展开到字段
子主题
漏斗模型
主要关注点4个
(1)体量(粗细、容量)
商机
(2)流速
及时
(3)体形
销售策略
(4)斜率
精准定位重要问题的阶段
在销售管理业务中,对动态销售阶段变化情况进行监控管理的业务模型
适用于动态状态监控与分析
电商行业的主要应用——AARRR模型 P316
5个行为阶段
A:用户获取
A:用户激活
R:用户留存
R:获得收益
最后一个R:推荐传播
指标
ARPU:每用户平均收入
二八分析(帕累托分析)
不适用场景
①了解客户生命周期
②了解付费流程转化效果
③了解不同时间点的趋势变化
预警分析
(1)适用
①机房温度
②内存消耗情况
(2)不适用
①销售额
②客单价
波士顿矩阵模型
RFM模型
客户群体分类
大众会员
进阶会员
忠诚会员
保值会员
营销实现价值提升难度最小的用户群体
要有针对性的营销
电商行业中,当出现资金困难,而不能提升流量而想增加销售额的方法,针对性人群
各单词含义
R:最近一次消费时间间隔
F:消费次数
M:消费金额
横向分析vs纵向分析
横向分析
例子
①过去一年各类水杯的销量比对
②618活动中注册用户和非注册用户的销售额对比
③本学期语文、英语、数学成绩的平均值比对
纵向分析
例子
红富士苹果在过去一年每月的销量对比
电商行业
常见客户行为类指标
UV(访客数)
PV(浏览量)
常见的平台间引流计费指标:CPM & CPC&CPS
流量类指标:平均访问深度、访问次数、浏览量
常用词汇:SPU & SKU
每个阶段分析的任务
流量分析阶段
①了解流量渠道特征
②了解引流行为效果
③了解流量人群特征
对流量付费可能性大小进行描述,可了解获取流量的质量高低。
跳失率
适用于对付费可能性大小进行描述的指标
跳失率越高,流量付费可能性越低,流量质量越差
转化阶段
①了解流量付费情况
动销率计算
商品层级
发生销售行为数/总商品数
品类层级动销率计算
销售品类/总品类
黄金公式:流量*转化率*客单价
流量为王
指标:
不适用累计方法计算:银行存款&库存金额
课本内容
6.1 业务指标分析
6.1.1通用指标计算方法
1.求和类指标计算方法
2.计数类指标计算方法
3.比较类指标计算方法
1)均比计算方法
2)基准比计算方法
3)标准比计算方法
4)目标比计算方法
5)同环比计算方法
同比增长率:衡量季节性产品当期销量好坏程度的指标
6.1.2 场景指标
1.客户分析类指标
客户生命周期
1)新增客户类指标
(1)新增客户数量类指标
①新增注册会员数
②新增访客数(UV)——流量自身属性
③新增到店数
④新增下载用户数
(2)新增客户质量指标
①新增活跃用户数
②新增活跃用户数占比
③新增注册用户数vs新增注册用户数占比
④新增付费用户数vs新增付费用户数占比
2)留存客户类指标
描述客户质量好坏程度
留存用户数
可用”同期群分析“
3)流失客户类指标
客户行为特征 P291
线上电商行业的主要指标
①PV(浏览量)
浏览量计算:浏览了多少个页面
②访问数
访问次数计算:点击到达页面就访问1次
③平均访问深度
公式:浏览量/访问次数
④跳失次数
⑤跳失率
⑥其他
客户价值类指标 P292
1)收入类
(1)客单价
(2)LTV(用户生命周期价值)
(3)ARPU(用户平均收入)
2)成本类
(1)用户获取成本
体现
线下行业
市场+销售行为的费用指出
在电商、互联网行业
引流过程产生的支付费用
①CPM
广告计费模式:按每千次曝光作为计费参照标准的
②CPS
广告计费模式:按付费金额占比作为计费参照标准的
③CPC
(2)客户运营成本
2.产品分析类指标
业务阶段划分
产品的进货类指标
产品的库存类指标
产品的销售类指标
3个阶段
售前阶段产品销售类指标
售中阶段产品销售类指标
售后阶段产品销售类指标
3.业务行为分析类指标
营销行为常见指标
4.效果分析类指标
1)用于量化资产使用效率的效果分析类指标
(1)除存货资产外的各类资产周转率
(2)投入产出比
(3)坪效
(4)其他资产使用效率的效果分析类指标
①屏销
②翻台率
③店销
2)用于量化员工绩效水平的效果分析类指标
(1)绩效评分
(2)目标完成率
(3)连带率
(4)客户满意度
(5)其他
①出勤率
②迟到早退次数
③失误率
④被投诉次数
6.1.3 指标体系
1.概述
4个步骤
4个步骤对应的实施工具
2.搭建
GMV的拆解
6.2 业务模型分析
6.2.1分类模型
1.客户分类模型
RFM模型
用户贡献价值模型
用户忠诚度模型
2.产品分类模型
波士顿矩阵
6.2.2 漏斗模型
主要观测的4个方面
电商行业的主要应用——AARRR模型 P316
5个行为阶段
A:用户获取
A:用户激活
R:用户留存
R:获得收益
最后一个R:推荐传播
指标
ARPU:每用户平均收入
6.3 业务分析方法论 P318
6.3.1 八二分析方法(帕累托分析方法)
6.3.2 A/B测试分析方法
4个步骤
6.3.3 同期群分析方法
例子
6.3.2 因果分析方法
7.业务分析报告与数据可视化报表
图形
时间上的趋势:折线图
了解所有注册用户近7日的整体留存率可用的图
属于序列类图标
漏斗图
能够划归于决策树中属序列类图表
桑基图
饼图
数据标签使用恰当的是:百分比
雷达图
突出对象间差异程度
某电脑商有A、B、C三类品牌产品,应用于描述上述3类产品的不同性能差异
气泡图
条形图
统计类图表:可以用坐标轴
散点图
波士顿矩阵效果,展示各类产品特征
盒须图(箱线图、箱型图)
是可以展现一组数据的统计分布情况,即可快速确认数据的分布(包含数据中位数、四分位数)的图表
直方图
业务类图表:不能使用业务维度坐标轴
业务图形决策树的图表类别有
①构成类
②对比类
③序列类
④描述类
课本内容
7.1 可视化分析图标
业务图标决策树
按使用方式分类
比较类
实际值vs目标值:油量表、圆环百分比进度图
对象vs对象:柱形图、条形图、雷达图、词云图、树状图
雷达图使用注意点3个:8+属性+单位
地域vs地域:地图
序列类
主要
折线图、面积图、柱形图、漏斗图
构成类
主要:饼图、环形图、瀑布图
描述类
主要
直方图、箱线图、散点图
7.2 业务分析报表
7.2.1 业务分析报表的分类与区别
7.2.2 业务分析报表的创建方法
5步骤
1.业务理解
2.数据收集
使用5W2H思维模型
3.数据加工
4.数据分析
5.报表展示
7.3 业务分析报告
1.分类
2.注意事项
3.案例
(1)案例一
案例二——SaaS工具
主题