导图社区 银行数据治理
银行数据治理的框架,银行数据治理是一个全面且复杂的过程,旨在确保银行数据的准确性、完整性、一致性和安全性,从而提升数据的可用性和价值。以下是对银行数据治理的详细概述,包括其目标、治理现状、数据应用、平台工具、外部数据、治理机制等内容。
编辑于2024-07-01 15:10:04银行数据治理
概述
顶层设计
《平安银行数据治理工作指引》(2020年)
《平安银行元数据管理办法》(2019年)
《平安银行数据治理工作组管理办法》(2019年)
《平安银行数据质量管理办法》(2019年)
《平安银行数据标准管理办法》(2019年)
《平安银行数据质量现场检查管理办法》(2020年)
价值
评估数据资产的运营和应用能力,支撑数据价值转化和实现
指导数据价值体系治理方案的实施,满足数据资产的运营和应用要求
监督数据价值实现的绩效和符合性,并持续改进和优化
应用
利用大数据挖掘技术分析各类海量信息,发现市场热点与需求,实现产品创新服务
产品生命周期管理
客户需求挖掘
产品创新
加强内外部信息联动,重点利用外部信息提升银行风险防控能力
多维度、全方位建设信用风险防范体系
可视化分析信用风险传导
海量交易实时估值定价
提升市场风险管控能力
利用大数据技术提升经营管理水平,优化业务流程,实现精细化经营决策
经营决策
资源配置
过程改进
运维保障
治理现状
元数据问题
数据表、字段命名不规范,中文名缺失
数据表缺少描述信息
数据加工口径、加工逻辑无说明
字段缺少业务定义
统一的ID mapping
数据标准问题
不同系统间相同含义字段未遵循统一数据标准
数据码值虽有统一管理,但是未落地到个源数据库
数据质量问题
数据质量参差不齐,部分数据表中有乱码、脏数据
部分数据表中重要字段缺失率较高
数据表关联度较弱,部分关联键出现空值或者缺失较多的情形
增全量表表名未与规范一致(规范ID为增量表、FD为全量表,实际有差异)
数据生命周期管理
无数据表版本管理,无法追溯历史表流转记录
数据服务
数据质量报告内容不完善
权限属主不能及时更新、有误
面向分析的业务主题集市待优化
企业画像维度饱和率较低
血亲图内容待丰富
数据安全
数据应用
BI报表
数据的稳定性
数据分析
数据
构建业务主题
支付结算
云付款
云见证
见证宝
云收款
数字口袋
票据业务
企业主题画像
360画像
分析内容
经营分析
客群分析
运营分析
客户洞察
客户旅程
客户生命周期
数据挖掘
数据
构建特征库
公共特征库
企业基础信息主题
法人基础信息主题
身份信息
联系信息
金融产品行为主题
产品基本信息主题
信贷交易行为主题
债券交易行为主题
票据交易行为主题
资金流水行为主题
97+ 已提 4.22
见证宝行为主题
互联网行为主题
数字口袋操作
口袋银行操作
企业网银操作
物联网信息主题
设备手环
充电桩
新能源汽车
专题特征库
个人征信主题
一代个人征信
预计280+
二代个人征信
预计690+
企业征信主题
税务
发票
黑名单
灰名单
风控规则特征库
预计200+
业务特征库
数字分特征库
70+
反欺诈特征库
预计300+
维表
图仓
本体库
实体库
关系库
事件库
挖掘方向
信贷模型
申请评分卡模型
预测是否该通过客户的借款申请。借款行为的发生就像泼出去的水,一旦发生,就无法被撤回。所以要尽可能准确地判断客户会否偿还该笔借款。贷前如果一个客户的评分过低可以直接拒绝,而通过的客户也可以根据评分高低制定差异化初始额度。
数据
个人基本信息
公共信息
信用款信息
查询记录信息
行为评分卡模型
基于客户发生的行为,重新评估客户的风险。授信通过后的用户产生一系列行为数据,例如借了几笔贷款、间隔多久、还款习惯怎么样等等,这些数据进一步刻画了用户的可信任度。贷中管理,在不同时间点对客户基于更新的数据情况重新评估风险,是精细化用户管理必须做的事情。
数据
个人基本信息
公共信息
信用款信息
查询记录信息
催收评分卡模型
预测无须采取措施或者必须采取措施进行催收的客户。一些逾期行为能自行修正,一些只需要适当的提醒,剩下的那部分借款人才需要采取严厉的措施。不仅是要不要催的问题,还可以建模预测什么时候催、以什么方式催,从而智能分配话务员在最优的催收时间下选用最优的催收话术和客户对话。另外,要和客户对话得先联系上客户,于是还有失联修复的问题。
数据
客户信息
还款信息
交易信息
征信信息
预期信息
催收信息
提额模型
前者预测可以增加额度的客户,以及必须减少额度或者取消额度的客户;这也是精细化运营的工作,也可以说属于行为评分的范畴。因为贷款机构的目标正在从降低借款人在贷款产品中的违约率变成提高客户带来的利润率。
息费敏感模型
后者是预测哪些用户对息费敏感,这部分人升息就可能导致其利用率急剧下降。
多头风险模型
从多头共债的角度预测客户的违约风险。多头借贷变量涉及到共债信息,与还款能力和还款意愿挂钩,多头严重就存在借新还旧的可能,一旦有平台拒借,客户就丧失了还款能力,一旦还不起,也可能就不愿意还了。用多头变量来预测逾期风险,效果通常较好。
多头借贷预测模型
以多头程度为目标变量,多头和信用风险一样,是动态变化的,预测用户通过之后的多头严重程度,也是有意义的。并且其优势是可以利用申贷样本建模,因为不需要有滞后的风险表现。
营销模型
用户现金贷需求预测
预测客户有无现金贷款的需求。面向支付的花呗显然用户规模远远多于面向借款的借呗,因为更多的人是为了支付便利而使用支付宝,而不是借款提前消费。对有现金贷需求的客群去营销,才能对症下药。
营销响应模型
预测不同触达方式下客户的响应率。不同的人对同一个触达方式的反应是不一样的,有些人看到短信就愿意来,甚至有些人会自然找上门来,有些人则需要优惠券需要福利才愿意尝试你的产品。差异化触达是更有效率的做法。
借款可能性预测模型
预测客户未来一段时间内发生借款行为的概率。客户借还一次,带来的利润是不够的,实际上,因为获客的成本不断增加,优质客户多次借款才能覆盖成本。对借款可能性的预估,可以帮助你更好地服务这些稀客。如遇到资金储备不足,也可以限制对这些人的营销,防止集中借款导致资金缺乏。
客户流失模型
预测客户未来一段时间内会不会流失,和借款可能性大致相反。对于高流失可能的客户,应该尽早地想办法挽留,因为一旦流失,重新唤醒的难度不亚于一个纯新户的获客。
模型分的有效性预测模型
模型预测的高分段好用户多,低分段坏用户多,但并不都是好用户或坏用户。评分的效用是群体有效,而非个体有效。那预测结果和真实表现差别大的群体,就是模型分有效性不足的群体,这部分客群如果能有效地被识别出来,就不应该采用这个评分工具。
画像模型
收入模型
预测客户的收入情况。收入模型可能是应用场景最多元化的模型之一了。在风险层,高收人群至少避免了因还款能力不足导致逾期的可能。在非风险层,高收人群尤其是营销获客的香饽饽,甚至很多增长运营团队的核心指标就是此类客户的数量。
负债模型
预测客户的负债情况。收入的另一面就是负债,客户显然更愿意支付房贷、车贷等大件物品的每月账单,剩下的才是用户的可用流水。负债收入比过高,贷款逾期风险往往就很高。
破产模型
预测具有破产可能性的客户或者企业。相比之下,企业的同质样本比个人的同质样本少得多,而且企业的财务数据容易被高管们操纵,导致企业破产模型的预测效果一般不如个人的模型效果好。
反欺诈
反洗钱
数据接口服务
平台工具
数据资产管理平台
数据资产目录
数据质量管理
数据标准管理
数据指标管理
数据安全共享
数据资产看板
数据架构管理
数据模型管理
高斯实验室
知识图谱平台
联邦学习平台
tableau
建设建议
问题梳理
数据源系统调研
数据使用方调研
数据治理
存量数据治理
增量数据监控预警
数据规范
落实表、字段命名规范
完善数据表描述信息
完善数据表业务定义,方便高效使用
明确各系统相同含义字段统一标准
数据管理
数据表版本管理
数据表规范管理
数据表更新管理
码值一致性管理
数据加工逻辑管理
数字资产管理平台
数据内容的维护与运营
数据表版本号
精品主题
企业画像主题
税务数据
工商数据
企业征信
个人征信
资源支持
业务专业
数据人员
会议讨论
痛点
数据架构有待优化
由于全行的数据散落在各个业务系统中,没有进行有效整合,形成竖井式架构,造成多个信息孤岛,整体架构缺少一个稳定的、抗源变化的保存最细粒度历史数据的数据层。无法支未来共享性应用。
缺少统一的数据标准
缺少统一的应用分析标准
缺少统一的基础数据标准
数据质量方面
没有归纳并总结数据质量问题,缺少反馈机制导致长期存在各类数据质量问题。
目标
提高数据应用效率
解决关键场景数据质量
确保安全
支撑场景(二维矩阵)
监管报送合规性
内部经营决策有效性
支撑关绩效发展分析的数据
客户营销:活客价值的挖捉
产品创新
新技术应用(5G)
客户运营支撑、交叉营销(企业信运营)
数据来源(二维矩阵)
内部数据
外部数据
执行方案
分解场景
创新型产品、
客户营销
物联网共融
效率提升
梳理中台支撑能力现状
通过统一数据视图、指标、标签的提升改进效果
质量提升
数据质量问题解决数量(持续性)
分析探索人员主动提前发现数据质量问题
组织能力
郭凯霞总牽头
混编组织(数据治理专员、数据管家、研发园队、产品经理、数据分析)
明确人员绩效目标和职责
数据地图
展示渠道
数据资产平台
20楼大屏展示
赢家APP
展示内容
大数据瓶体整体情况
外部数据接入情况
内部数据汇聚情况
专题数据接入情况
功能
大屏展示
可交互下钻
实时更新
精品数据
数据的分类编目
?数据的统一门户
子主题
银法通
财资
信息查询
税务
公积金
子主题
甲乙丙丁
药师帮
货友友
数据治理
盘点数据,绘制数据地图
全行外联
对公外联
建立治理标准
外部数据治理
接入数据有效性判断
存量数据管理
外部数据
多少字段
多少条数
支持多少业务场景
全生命周期管理
联机接入相关标准
接入接口的技术标准
接入测试管理
日常监控
数据源管理
汇报
数据接入情况
数据探查情况
数据使用情况
外部数据
征信
人行征信
前海征信
百融征信
工商
中数智慧
司法
法海风控
高法数据
金融资讯
万得
百川
舆情
拓尔思
治理机制
外部数据接入前
数据需求分析
1、业务需求分析
2、外部数据探源
3、外部数据质量评估
4、多业务应用场景统采机制
5、用数需求替代性分析
数据接入开发
1、统一平台数据接入
2、统一平台数据存储
3、统一接口参数标准
4、统一数字典标准
5、统一对外数据服务
外部数据接入后
数据质量监控
1、多维度动态监控关键数据要素质量
2、动态评估和分析供应商的数据质量和服多质量
3、持续闭环管理质量问题
数据安全管理
1、数据产品统一安全鉴权
3、敏感数据统一申请流程
2、高敏数据统一加密保存、脱敏展示
数据运营管理
1、数据资产上架
2、数据运营报告
3、数据模型管理
4、数据标签建立
5、数据应用推广
生命周期管理
1、全行统一外联储存近6个月数据作为接口复用数据
2、历史数存存储到大数据平台
3、根据监管要求的销毁相应数据
外部数据质量评估体系
数据供应商背景调研
基本信息核实
相应资质核实
数据来源核实
风险信息核实
评估内容
首次接入
客户覆盖度
满分25分
定量
客户查询命中率*25
核心字段准确率
满分35分,30分为质量分,5分质量问题响应分
定量
数据更新时效
满分10分
根据厂商数据更新时效和银行端获取结果最终更新时效进行评分:
更新时效完全符合业务要求:7-10分;
更新时效比较符合业务要求:5-7分;
更新时效不符合业务要求:1-5分。
定性
数据饱和度
满分10分
定量
持续评估
服务质量
满分5分
服务稳定性3分:稳定得3分,较稳定得2分,一般得1分,不稳定的0分
定制化开发2分:支持定制开发得2分;不支持定制开发得0分
定性
价格优势
满分5分
定量
历史情况
满分10分
定量