导图社区 《别拿相关当因果》
《别拿相关当因果》因果关系逻辑读书笔记,作者:萨曼莎克。
编辑于2018-11-26 15:36:28《别拿相关当因果》
作者介绍
萨曼莎·克莱因伯格(Samantha Kleinberg),计算机科学专业博士,现任斯蒂文斯理工学院计算机科学专业副教授,致力于研究那些只可观而不可进行实验的系统的运行原理。
Research Interests The common theme in my research is the study of systems with a temporal component. My work is motivated by applications in human health, and includes developing algorithms for understanding how complex systems function, applying them to challenging biomedical datasets, and using these inferences to make decisions.
academic book<Causality,Probability and Time>
因果关系与逻辑
目录整体介绍
什么是原因,我们为什么常常弄错原因?Ch1-3
I.引子
是什么,为什么,怎么样p10
因果推理中尚未解决的问题P12
II.心理——人们是如何寻找原因的?
我们是能够感知到事物间因果关系的vers休谟只能观察 对婴儿实验
推理与论证方法
协同变化法(事件共同发生的频率),关联法本质——休谟:如果人们经常看到一些事件同时发生 就会假定它们之间存在因果关系
关联法漏洞——区分事件中共同原因结果?——反向阻断法p30
建立在作用机制上 原因是促成结果的一种途径 找事件链
因果关系知识的适用性;文化、社会因素影响;为何容易受因果谬误影响?(迷信?小人)
III.相关性——被搞错的因果关系
长跑与减肥;吸烟与健康。同一原因via不同路径产生积极消极影响 观察不到相关性或很弱
原因理解层面的什么时候与为什么同样重要 Ch4
IV.时间——时间如何影响我们感知因果关系和进行因果关系推理的能力
祈祷实验——“当下某个原因能够某件时间在过去发生”统计学具有显著性 但是不接受与先验信念极为矛盾的结论 事件发生顺序对因果关系至关重要 在意时间延迟
时间的逻辑谬论
时间相近性——后此,所以因此;随此,所以因此
治疗抑郁药物使人有自杀倾向?先发生事件与最终结果可能是一个共同原因导致(抑郁者自身)
漫长时间间隔的问题(无法推理;结果紧随原因出现 无法找到真正因果关系)
只通过观察找到原因Ch5
V.观察法
穆勒五法——严格
契合法
异中求同 c是e必要条件(非c那么非e)p101
差异法
同中求异 充分条件
差异契合并用法
如果某被考究现象出现的各个场合(正事例组)只有一个共同的因素,而这个被考察现象不出现的各个场合(负事例组)都没有这个共同因素,那么,这个共同的因素就是某被考察现象的原因充分必要条件
共变法
存在问题(时间章)
如果某一现象发生变化另一现象也随之发生相应变化,那么,前一现象就是后一现象的原因
剩余法
abc是复杂现象ABC的复杂原因,a是A、b是B的原因,则c是C的原因
不严格——概率法(关系本身不确定性 eg量子力学)
辛普森悖论——因果关系可能消失或者表面上好像发生了逆转
AB医生治疗效果问题——划分 同样风险等级病人(铀矿工人)
不能完全脱离知识背景单独讨论因果关系问题,选择数据分析对象 划分
反事实推理
C引起E必须有—如果C没有出现,那么E也不出现;如果C出现,那么E也会出现
局限—超定实例(多余因果关系的对称形式)结果并不依赖每个原因 eg拉斯普金案
数据特征对推理的影响Ch6
VI.计算法——如何自动实现寻找原因的过程
隐藏的共同原因或潜在的混杂因子-混杂和遗漏变量偏差是观察研究也是计算法输入内容的主要局限之一
图解模型表示因果关系:一个变量的概率只取决于引起这个变量的原因;所有的共同原因都要测量到;使用的数据准确反映了变量之间真正的依赖关系
实验怎么克服数据特征带来的挑战 Ch7
VII.实验法——如何通过人和系统进行干预来寻找原因
随机对照实验
双盲|三盲实验
通过控制试验来保证内部有效性常常会牺牲外部有效性(试验结果具有更广泛的普遍性)二者重要性取决于我们的目的
我们之所以认为有些因果关系是可能的,是基于我们对这个世界运行机制的认知
运用专业性策略解释原因Ch8
VIII.解释
类型层面与实体层面的因果关系p195
寻找事件发生的原因-使用类型层面原因解释实体原因挑战
1.出现多重原因时 根据每个因素导致的结果比例划分责任比例vague;更加具体界定解释对象 解决表面上超定案例 运用反事实推理法时不要只看结果会不会发生而是要看结果是否会以不同的方式发生
2.解释可能具有主观性
3.时间,我们掌握的类型层面的信息并没告诉我们某个原因需要多长时间才能导致某种结果
放松类型层面和实体层面关系之间的联系,观察到的和我们已有认知并不吻合 将这种不确定性融入我们的解释当中。根据我们所掌握的实体层面的信息来对类型层面的显著性值进行加权处理。
实体与类型层面分开来看
一个事件可能会提高某个结果出现的概率却不会导致这个结果的出现(不同于超定案例)
法律活动中的因果关系
有些哲学理论认为某些案例是无法解决的 比如超定事件但在法律活动中不能接受这种说法 因为无论如何都要做出判定
交通事故案例p214 超定案例中两个或以上因素都可能是导致某个结果的原因其中任何一个都无法被判定为导致结果的唯一原因。在优先权案例中,可能导致某结果的原因有两个 但实际上起作用的只有一个eg病人死亡是致命疾病or护士撤设备
反事实推理法的缺陷之一在于将每一个原因分开考虑而不是将每个原因当做导致某种结果的整体背景中的一部分
陪审团
听审过程中不会把每条新证据放进互不相干的证据库中,不会在每个时间点总结,而是根据庭审提供的证据和他们的先验知识和经验组织出一个故事再现案情。
构建故事的信心来自于故事的覆盖面,连贯性和独特性。
庭审最具挑战性的特征是证据是随着时间而逐条提供给陪审员的,却不一定是按照时间顺序提供给陪审员的。
很多关于陪审团如何思考问题研究来自模拟陪审团的研究,与真实审判相比:真实审判中时间跨度很长信息,案情重大决定,成员选择流程
根据原因进行决策Ch9
IX.行动
对因果假设评估
1.强度
事物间联系弱也可能有因果关系(二手烟和吸烟对肺癌影响);甚至决定性
事物间出现很强相关性却不存在因果关系——我们需要考虑:关系是否对称,共同原因导致,是否是方法问题(范围限制 选择性偏差失误) 是否忽略其他与结果密切相关的因素等等
2.一致性(可重复性)
考虑:是否准确复制研究方法;研究目的是再现主要结果吗;未成功是否可能是研究群体或方法显著变化造成的;结果大小是否一致;研究彼此独立吗;有足够动力让我们发现某个原因导致结果
3.特异性
不仅仅是一个原因导致各种结果之间差异还包括对每一个结果的影响程度,意味着我们推理出的关系到底有 多直接。p232
取决于我们的认知程度
4.时间性
时间之间顺序正确吗;是否是由数据收集方式或失误导致的人为结果;时间间隔合理吗;时间间隔很长 结果有没有可能是其他因素干预导致的
5.生物梯度
针对不同的原因值结果的量会发生怎样变化;如果能控制一个人与原因的接触是否可以改变他面临的风险程度;是否能够改变原因所导致的各种结果’我们对剂量的测量到底有多精确
6.可信度与连贯性
评估已有的认知
7.实验
不在人身上实验:确定替代品是否能够反映某原因在人体内起作用的方式——人体实验伦理法规 受试者“知情同意”原则 对实验目的危险知情,自由意志下同意
8.类比性
适用性问题,背景的问题谋杀案标准>哪个小孩打翻花瓶;一个很弱的证据证明每天一块巧克力改善心情,证据对于一个人坚持吃巧克力可能是足够的;但却不足让我们制定一个建议人们每天都要吃巧克力的国家营养标准
根据原因制定政策
了解背景
效力和效果
效果和效力(根据理想化设置推理出来的)在医学上最明显。决定选择什么样的干预措施时不仅要考虑效力还要考虑在实际条件下是否能够成功。
意外的结果
X.展望——为什么要研究因果关系
今天,随着我们收集的数据集越来越大,因果关系以及对因果关系进行批判性思考的能力比以前任何时候都更加必要。我们需要将人类能够在深思熟虑的基础上进行判断的优势和计算机能够以一种人类无法企及的方式对海量数据进行挖掘的优势结合在一起。
一套基于原因的思考体系:要问的问题,应引起怀疑的危险信号以及证实因果关系的方法。找到事情发生原因之外,基于因果关系作出决策,制订策略,通过进一步测试验证找到的原因。
eg按时上班和吃丰盛早餐