导图社区 标签类目体系
这是一篇关于标签类目体系的思维导图,讲述了源的六段由来过程、术的使用技法与重要问题、标签工具和经典模板、法的完整设计方法等。
编辑于2021-09-07 08:44:52标签类目体系
chapter1:因-6大数据困局
数据孤岛,无法打通
技术原因:大型企业根据不同业务线会采购不同的信息化工具,当前业内一般采用离线数据同步和实时数据同步两种技术方式来进行数据迁移打通
管理制度原因:信息化建设初衷往往是满足业务线自身需要,无形间形成了数据交换的壁垒
数据观原因:各部门各自为政,数据不打通,大家各行其道,数据观的构建需要3-5年的时间不断耕耘建设,甚至需要融入企业的文化建设中
针对于数据孤岛问题,可以从以下方面解决:塑造企业的数据认知,推动部门间的数据融合,选择数据同步的技术和工具
烟囱式建设,重复造轮子
烟囱越建越高,难以支撑,各部门从自身出发的数据建设如同工厂中的烟囱,纵横林立,没有联系,过于关注部门内部需求,无法获得跨部门的数据资源,也无法获得全局事业上的数据支撑
数据治理在局部难以取得成功
重复投入容易造成资源浪费
各说各话,没有统一口径
指标往往以责任部门的数据为准,会存在同名不同逻辑的处理方式,需要做大量的记录存档工作,问题的本质在于企业内部缺乏对数据指标的统一规划和控制
解决方法
形成数据工作的标准流程与规范
完成对数据信息项的全面梳理,数据部门应该尽可能为业务提供多的指标信息作为业务支撑
授权数据部门对指标进行统一定义
鸡同鸭讲,无法穿透业务层
一方面,数据人员基于自身认知体系进行宣讲,沉浸于数据世界,没有将自己代入业务人员的思维;另一方面,业务人员对数据学习心存障碍
解决方法
企业内部树立统一的数据观,这是第一要务
学习模式和背景不同的人员需要掌握将感性思维和理性思维综合运用的能力
业务人员和数据人员需要尝试互相学习、补足对方的专业知识
数据治理没有尽头
常用的数据治理理论包括DMBOK、DMM、DCMM
常见问题
专业门槛高,涉及板块多,周期长
缺乏业务配合,治理难度大
可以跳出原有固化的数据治理模式,从业务出发,找到数据核心价值,以价值来联动数据和业务部门,共同完成数据资产设计、数据资产治理、数据资产使用等过程
被命运扼住咽喉的成本中心
数据部门是成本中心,业务部门是利润中心,
推动力方面,业务部门无往不利,数据部门步履维艰
数据部门应该通过数据价值去扭转局面,跳脱出成本中心的桎梏,将自己打造成利润部门,将采购的服务器、数据源、工具平台作为成本,产出的数据服务、数据应用看作定价售卖的数据产品
chapter3:义-3点产生必要
数据资产可复用
标签类目体系是中台概念的核心落地点
前台与后台的矛盾:前台灵动,后台稳定;前台打通,后台天然不打通;前台越拆越小,需要速度,后台越建越大,需要全面
数据中台的要义
前台调用数据资源是中台能快速响应
把经常用到的数据资源沉淀在中台
面向业务可理解
需要更具价值的数据资产
好的数据资产特征
连接数据和业务的中间逻辑层
统一的对象数据描述方法
具有第一性原理
数据资产必然走向业务导向
数据操作系统下的数据资产流向
数据价值可衡量
数据商品化
数据价值分配模式
标签是数据商品最适合的颗粒度
数据商品化全流程运营
根据业务场景需求,按照标签类目体系方法论设计标签集
创建标签后生成标签开发任务,分配各数据开发工程师或算法工程师
业务人员可以搜索、浏览、查看标签化的数据商品信息,包括标签名称和标签详情、功效、可应用场景、用户评价等
通过服务画的工具,将选中的标签集快速配置成数据服务或数据应用,以供下一阶段配置数据服务使用
业务使用过程中沉淀的日志、反馈、事故等信息都可以用来更好地管理标签和服务
标签管理过程可以更好地优化现有标签设计
chapter5:法-完整的设计方法
构建前提
统一的数据思维
数据认知:数据在哪,数据价值在哪,数据怎么用
数据架构:数据业务化、数据资产化、资产服务化、服务业务化
执行保障:领导层给出数据战略的方向指引,管理层将数据战略转化为战术包装,执行层需要根据作战计划和考核指标保障数据流的平稳推进
价值驱动、场景能力
充分的前期调研
业务场景调研
需求痛点调研
数据摸底调研
正确的落地思路
根据业务流程梳理数据类目体系
从流程中抽取出“人”、“物”、“关系”
根据业务需求设计标签类目体系
设计步骤
识别对象
识别人、物、关系,关系可以包括了浏览记录、购买记录、生产记录、物流记录等多种对象
同一对象数据打通
ID-Mapping技术、One-ID
第一级别ID:强身份属性ID;第二级别ID:设备相关ID;第三级别ID:注册账号相关ID;第四级别ID:临时记录相关的ID
数据化的事务表达
实例解析、参考语义解析
数据库表映射
构建数据类目体系
构建标签类目体系
标签设计的两大前提:不能凭空设计,需要考虑标签开发落地的数据可行性;标签必须是业务上需要的,能够帮助业务人员作出业务判断、支撑、帮助的数据项
标签是对某一对象的属性刻画,标签值是标签具体的取值,需要严格分清标签和标签值的区别,避免产生动辄成百上千的标签
标签设计的思路:从核心词属性出发,如通过偏好引申出各个不同类型的偏好;从包含、拥有角度发散,设计出生理参数;从详细内容出发,如对象ID、商品ID;从发展过程出发,如基于浏览路径设计;相同类型事物的统一抽象,如兴趣爱好等
常见问题:避免信息冗余;提取规划将来会用到的标签,指导业务;类目体系的分层需要尽量考虑未来的适用性,原则上不超过三级,每级分类不超过10个
前后台标签类目体系
后台标签类目体系指的是数据资产的全集,所有需沉淀、可复用、有价值的标签池,数据资产设计师或者管理员可以创建、维护后台标签类目体系,其他人员可以查看,但是不可以修改。与业务场景松耦合,体系比较稳定
前台标签体系侧重对业务场景的响应,依据业务需求来汇集所需的标签集合,并根据业务的理解对标签进行分类,以供业务系统或数据应用调用
前台标签一般按照大场景/子场景/数据服务等层级展开,先抽象出所涉及的对象,再去后台标签类目体系该对象的标签总集中找到该数据服务所需的标签。可以将前台标签类目看作是后台标签类目的一个标签子集
chapter7:标签工具和经典模板
标签体系设计:对象设计、类目设计(层级)、标签设计(绑定逻辑标签与物理字段)
标签同步与加工
标签同步:根据业务场景进行数据源和目的源梳理
标签加工:拖拽式或者sql代码
标签管理:标签维护(上架、下架、解绑、修改)、标签标准、标签质量、标签价值、标签安全
标签门户
资产概览:可视化标签使用、创建、调用、价值等统计信息
标签集市:支持对标签进行关键词搜索,也支持对标签进行分对象、分类目查看
标签使用
数据查询
群体洞察
群体圈选
群体分析
微观画像
chapter6:术-使用技法与重要问题
标签规范
标签化
根目录指向标签所属的对象
类目是对标签的分类
标签是对象的属性,颗粒度到字段级
标签值是对象属性的具体取值
元标签
根目录、标签所属类目、标签名(格式规范、用词规范、内容规范)
标签描述、加工类型(原始、统计、算法)、标签逻辑、值字典、取值类型、示例、更新周期
安全等级(L1-L4)、物理存储信息、负责人、完成时间
组合标签
同一对象下的组合
单个标签加工
多个标签加工
不同对象下的组合
标签运营
标签的全生命周期运营
标签设计
数据资产设计师
标签开发
数据开发工程师、算法工程师
标签上架
标签使用
数据同步:直接同步到业务系统,只有核心业务可以使用
数据应用:标签功能封装成产品交互形态供外部使用,与业务方绑定较深
数据服务:封装成API形式对接到业务系统
标签治理
血缘信息
元标签规范
质量管理
安全管理
标签营销
标签质量管理
来源类:数据源安全性、数据源准确性、数据源稳定性、数据源时效性、数据源全面性
加工过程类:标签测试准确率、标签产出稳定性、标签生成时效性、标签覆盖度、标签信息完善度、标签规范性、标签离散度
使用过程类:标签使用准确率、标签调用量、标签受众热度、标签调用成功率、标签故障率、标签关注热度、标签持续优化度、标签持续使用度、标签成本性价比
chapter2:源-6段由来过程
标签类目体系方法论背景
构建消费者信息库
打通数据侧与业务侧:通过与业务人员的沟通,为业务侧打造数据解决方案
激发业务人员使用数据的兴趣
实现数据资产商业价值闭环,需要紧密围绕标签使用价值的主线
ID-Mapping打通数据
PC向无线转型是ID打通的历史契机
ID-Mapping技术实现各源数据打通
精准营销的完整闭环:数据接入、客户识别、人群圈选、透视分析、定向投放、回流优化
数据接入
B2C业务板块融入、O2O数据接入、金融数据合作
数据化运营
给部门考核增加了接入使用标签资产库的程度,此后各业务系统都有数据回流的接口,数据源按周期调度并与数据中心同步;将数据资产可视化,由财务部门牵头,将一部分收益划拨到数据事业部的结算清单
更广泛领域的实践
对象拓展:从消费者拓展到商品、楼盘、员工,乃至于生产、运营、导购
标签场景化:不应该将人简单视为纸片人,应该仔细推敲,增加标签的场景、时空维度,使标签能够还原出任意场景的立体对象
标签类目体系方法论
方法梳理
梳理数据资产设计方法论的过程中,第一步应该关心标签的核心本质-“对象”
数据资产设计方法论中,对象分为“人”,“物”,“关系”
确认标签对象后,开始梳理对象的属性-标签
原理研究
以树为原型的理论框架
不断完善的过程
标签术语
标签:从原数据加工而来,能够直接为业务所用并产生价值的数据载体,从本质上讲,标签也是一种数据,往往映射为某一对象的属性,包括固有属性和动态属性,需要结构化到字段粒度,可以分为基础类标签,统计类标签和算法类标签
元标签:标签的标签,对标签的属性信息(特别是业务化属性信息)梳理
类目体系:对某一类事物的分类、架构、组织方法,可以用树状结构类比
对象:标签体系中的对象分为人、物、关系(包括社交关系、行为关系、社交关系、同好关系)
后台类目体系:面向数据资产管理人员,是企业数据资产的拳击,较为稳定,按照统一的分类方式进行标签的挂载、查看、管理
前台类目体系:根据场景需要,将标签按照前台场景组织新类目,形成前台标签类目体系
chapter0:前言
数据标签化
标签设计:把各种对象充分“微分”的过程,解析和拆分得足够精细
标签使用:将场景涉及的对象标签拼装在一起使用,是一个“积分”的过程
传统方法与标签化对比
传统的数据处理是业务到数据再回到业务的快速贯通
传统的数据处理快速、简洁、干脆
同一份数据在跨业务、跨时间的应用中,经常存在复用困难的问题
标签化的数据处理需要数据经过标准化组织后规模复用
源数据不能在处理后直达业务现场,需要经历数据资产仓库的过程
业务使用数据需要拿提货单到资产仓库中挑选
传统的数据方法适用于对数据服务产出时效有严格限制、只关注某一个局部的应用场景,即使是在大企业也在被普遍使用
标签化的数据处理已经是一种中台模式了,业务人员无论在何时使用资产都可以根据充分公开的标签信息自由下单,标签之间可以自由组合,适用于业务场景多样化的大型集团产业
传统方法和标签化数据方法的选择,本质上是效率问题和商业问题,需要聚焦“慢就是快”的长线思维和“唱本降低,收入增加”的财务方式
中台2.0时代
当前很多企业停留在数据梳理、整理、数仓建设阶段,数据部门把自己变成了庞大的成本中心,数据治理项目无法满足业务需求
数据资产是能给业务带来经济价值的数据资源,数据中台的价值在于让业务快速试错,在试验中发挥数据的商业价值,因此比起开发、治理、管理应该将注意力放在寻找能给业务带来价值的数据资源
通过标签作为数据资产的逻辑载体,有了标签对物理数据的逻辑映射,数据对业务人员来说就不是无法触碰的数据虚体
应运而生的岗位数据产品经理,现在应该叫数据资产设计师,以后一定是数据资产使能者:专心研究业务所需标签,将其设计和开发出来并在数据中台的数据资产库商家,让业务人员使用,从而缩短数据资产使用周期,降低试错成本