导图社区 DAMA-CDGA数据治理工程师-2.数据处理伦理
数据伦理是指如何以符合伦理准则的方式获取、存储、管理、使用和处置数据。伦理准则通常侧重于公平、尊重、责任、诚信、质量、可靠性、透明度和信任等方面,对于数据管理专业人员及其工作的组织来说,数据伦理是一项社会责任。
不是因为新组织宣布成立或新系统实施上线就要变革,而是人们认识到变革带来的价值而发生行为变化时,变革就会发生。
随着数据领域的快速发展,组织需要改进管理和治理数据的方式,数据管理和数据治理组织需要足够灵活,才能在不断发展的环境中有效的工作,因此,它们需要澄清关于所有权、协作、职责和决策的基本问题。
能力成熟度评估是一种基于能力成熟度模型框架的能力提升方案,描述了数据管理能力初始状态发展到最优化的过程。当一个组织满足某阶段能力特征时,就可以评估其成熟度等级,并制定一个提高能力的计划。
社区模板帮助中心,点此进入>>
项目时间管理6大步骤
项目管理的五个步骤
电商部人员工作结构
电费水费思维导图
D服务费结算
暮尚正常运转导图
产品经理如何做好项目管理
车队管理
创业者10条创业经
创业十大思维误区
2.数据处理伦理
引言
伦理
伦理是建立在是非观念上的行为准则
伦理准则
伦理准则通常侧重于公平、尊重、责任、诚信、质量、可靠性、透明度和信任等方面
数据伦理
数据伦理指如何以符合伦理准则的方式获取、存储、管理、使用和处置数据
对于数据管理专业人员及其工作的组织来说,数据伦理是一项社会责任(但不是法律问题)
影响
对人的影响
由于数据代表个人的特征,可被用于各类决策,从而影响人们的生活,因此需要保证其质量及可靠性
滥用的可能
滥用数据会对人和组织产生负面影响,因此需要防止数据被滥用
数据的经济价值
数据存在经济价值,需要规定数据的所有权,即谁可以用数据以及如何使用数据
保护数据的动机很大程度上来自法律法规的要求,但是应意识到保护数据并且确保其不被滥用除了法律约束以外还有伦理因素
伦理准则不仅要保护数据,而且要管理数据质量
从业务和技术角度看,数据管理专业人员都要有管理数据的伦理责任,以降低数据可能被歪曲、滥用和误解的风险,这种责任贯穿从数据的创建到消亡的整个数据生命周期
业务驱动因素
按照符合伦理准则的方式使用数据越来越认为是一种商业竞争优势
组织构建数据处理伦理准则的主要原因是为了降低所负责的数据被员工、客户、合作伙伴滥用的风险
保护数据不受犯罪分子侵犯也是一项伦理责任
不同的数据所有权模型影响着数据处理的伦理规范要求
例如共享数据能力,这种能力意味着组织有责任在使用共享给他们的数据时进行伦理决策
基本概念
数据处理伦理准则
尊重他人
这个准则反映了对待人类最基本的伦理要求,即尊重个人尊严和自主权
准则还要求,人们在处于“弱势”的情况下,应格外注意保护他们的尊严和权力
当把数据作为资产时,内心一定要铭记数据也会影响、代表和触动人
不伦理的使用个人数据会直接影响人们之间的相互交往、就业机会和社会地位
行善原则
两个要素:第一,不伤害;第二,将利益最大化、伤害最小化
伦理的数据和信息从业者应识别利益相关方,并考虑数据处理和工作的结果,以最大限度的提高效益并最大限度的降低设计过程造成的伤害风险
公正
这一准则认为待人公平和公正
尊重法律和公众利益
数据隐私法背后的原则
欧盟通用数据保护条例GDPR
加拿大隐私法PIPEDA
美国联邦贸易委员会FTC隐私方案标准
违背伦理进行数据的风险
数据可以被歪曲,同时可以创造一个事实的虚假表象。方法包括主观数据的选择、范围的操控、部分数据点的遗漏
场景
时机选择
有可能通过遗漏或根据时间将某些数据点包含在报告或活动中而撒谎
“日终”股票交易操控股票、商业情报人员
可视化误导
图标和图形可用于以误导性方式呈现数据
例如,修改比例尺使趋势线看起来更好或者更糟
定义不清晰或者无效的比较
在展示信息时,符合伦理的做法是交代清楚事情的背景及其意义
如人口普查时,清晰、明确的说清楚普查人口的定义,以及会有哪些福利和好处
省略了相关的背景信息,呈现出来的表面现象可能是数据不支持所需的信息
不管这种效果是由于故意欺骗还是由于能力不足所致,这样使用数据都是不道德的
偏见
偏见是指偏离期望
通常是通过抽样或数据选择的系统错误引入的
可能在数据生命周期的不同时间点存在
在数据被采集或者创建时
当它被选中用于分析时
分析数据的方法
及分析结果的呈现方式都可能存在偏见
类型
预设结论的数据采集
分析师迫于压力采集数据并产生结果,来支持一个预先定义的结论,而不是为了得出一个客观的结论
预感和搜索
分析师有一种预感,且想要满足这种预感,故只使用能证实这种直觉的数据,并且不想考虑从数据中得到其他的可能性(如果某些数据不能证实该方法,它可能会被丢弃)
片面抽样方法
为了限制偏见,可使用统计工具选择样本并建立适当大小的样本
背景和文化
偏见通常是基于文化或背景,因此,要中立的看待事物,就必须走出这种文化或背景
消除所有偏见并不总是可行的,甚至是不可取的
业务分析师构建许多场景时,对低价值用户(那些不再产生新业务的客户) 有业务偏见是基本常识,他们会被从样本中剔除或在分析时忽略
转换和集成数据
对数据来源和血缘的了解有限
质量差的数据
不可靠的元数据
没有数据修订历史的文档
数据的混淆和修订
混淆和修订数据是进行信息脱敏或信息不公开的常用方法
但是,如果下游的活动(分析或与其他数据集相结合)需要公开数据,那么仅仅混淆就不足以保护数据
风险存在于
数据聚合
跨越多个维度进行聚合数据并删除标识数据时,这组数据仍然可以用于其他分析服务,而不必担心泄露个人识别信息。按地理区域聚合是一种常见的做法
数据标记
数据标记用于对敏感数据(秘密、机密、个人等)进行分类,并将其控制发布到合适的社区
数据脱敏
数据脱密是一种只有提交适当数据才能解锁过程的实践
操作人员无法看到原本的数据是什么,只是简单的输入密钥,如果这些操作是正确的,就允许进一步的活动
建立数据伦理文化
评审现有数据处理方法
改善的第一步就是了解组织现在所处的状态
评审现有数据处理流程的目的是为了理解这些方法在多大程度上直接而且明确的与伦理和合规性驱动因素有关
这些评审还应该定义雇员如何理解现有做法在建立和维护客户、合伙人和其他利益相关方之间信任方面的伦理影响
识别原则、实践和风险因素
使数据处理的伦理规范化的目的在于降低数据被滥用,从而降低给客户、雇员、供应商、其他利益相关方甚至是整个组织所带来的风险
一个试图改善做法的组织应该了解这些通用的原则
原则应与风险、实践保持一致,应通过控制来支持实践
指导性原则
患者的健康数据除非被授权作为照顾患者的一部分人,其他人不允许访问患者的个人健康数据
风险
如果可以广泛访问患者的健康数据,会危害患者的个人隐私权
实践
只有护士和医生才允许访问患者的个人健康数据,并且仅用于提供护理
控制
对包含患者个人健康系统进行审查,确保只有需要访问的人才能访问
制定合乎伦理的数据处理策略和路线图
在评审当前状态并开发了一系列原则之后,组织可以通过正式制定策略来改善其数据处理方法
采用对社会负责的伦理风险模型
数据可能会被滥用并且与潜在的伦理标准相抵触
伦理观点之所以重要,不仅因为数据容易被滥用,而且因为组织的社会责任不允许其损害数据
数据伦理和治理
数据处理行为的数据监督属于数据治理和法律顾问范畴
他们必须了解法律的最新变化,同时确保雇员了解自己的义务以降低伦理不当带来的风险
数据治理必须制定相关标准和制度以提供数据处理和监督的方法
数据治理有一个特殊的监督要求,即用于审查商务智能、分析和数据科学研究提出的计划和决策