导图社区 博弈论的意义
这是一篇关于博弈论的意义的思维导图,主要内容有1.博弈论2.当囚徒困境中的各方在博弈之中3.没有未来必然背叛4.带剑的契约才有效5.弱者—方如果没有筹码,则无效果。
编辑于2022-07-23 12:59:22博弈
1. 博弈论
运用数学方法研究 有利益冲突的双方 在竞争性活动中制定最优化的胜利策略
目的
利益
资源是有限的
获得的人是少数
竞争各方之间就会开始一场博弈
条件
有参与各方争夺的资源或收益
自己使用的是效用递减规律的作用
参与者有自己能够选择的策略
分析整体
找到关键因素
为达到最重要的目标进行手段选择
特定环境条件与规则下选择
同时或先后选择策略并实施, 从而得到某种结果的过程
结果
各方为了自己利益的最大化
而选择了某种最优策略
会达到一个平衡点
每个参与者都不会轻易改变
3个结果 (利益分析)
零和
相当于找接盘侠
双方位置互换
特点:损人利己
负和
两败俱伤的非零和博弈
大家都没有得到好处
正和
双方都得到利益
减少了很多不必要的争斗。
我们调解中尽量
过程
而现实生活中,人们在做决策时往往是
有限理性的。
精力和时间永远是有限的, 不可能掌握所有知识和信息
信息的搜寻需要成本,必须付出时间、精力和财力
意图搜寻到所有信息,企图做出收益最优的决策行为
但结果就是往往 最终决定不理性
典型案例
夫妻看足球
猜测结果与处理方法
一是两人争执不下.于是干脆关掉电视,谁都别看
二是你看足球。我到其他地方听音乐。或你听音乐,我到其他地方看足球;
三是其中一方说服另一方,两人同看足球或同听音乐。
较优选项
2. 当囚徒困境中的各方在博弈之中
特定条件
处于不对等地位的时候
博弈的局势很容易发生偏移
即从合作型的博弈走向非台作型博弈
如何设计不对等地位?
通过设计改变博奔参与者的格局,造成一种压力. 那么他们很有可能改变原来通谨共犯的合作,改而与“警察”合作。能够达成这种局面的设计可能有很多种,
但是最常用也最为有效的一种?
制造信息不对称性
生活模型
两学生谎称因 轮胎爆胎 而没法赶上考试, 教授如何揭穿他们,但是又冤枉他们?
设计考试,第一页是10分,剩下那页让他们答 是哪个轮胎爆胎,爆胎位置,为何会爆胎?
3. 没有未来必然背叛
车站为何卖那么多假货?
因为没有下一次
在社会联系紧密的人际关系中,人们普遍比较注意礼节和道德,因为他们需要长期交往,并且对未来的交往存在预期。对未来的预期是影响我们行为的重要因素。
一种是预期收益:我这样做,将来有什么好处;
一种是预期风险:我这样做可能将来面对的问题;
为何?
在任何博弈中,表现最好的策略直接取决于对方采用的策略
就是讲
犯人之所以会有罪供述
取决于 审犯的人,利用的筹码(刑期,求情,利益)
但是同时也是双刃剑
特别是取决于这个策略 为发展双方合作留出多大的余地。
4. 带剑的契约才有效
例如:没有履行好xx,就会受到xx的惩罚
每一个鼓励合作的方案里,通常都会包含 某种惩罚作弊者的机制。
博弈的参与者无法了解到在任何一步中,其他参与者的策略选择。 在重复型的囚徒困境中.签订合作协议并不困难,困难的是协议对博弈各方是否具有很强的约束力。任何协议签订之后,博弈参与者都有作弊的动机,因为至少在作弊的这一轮博弈中,可以得到更大的收益。
现实案例
若是抓到毒贩拒不供述
解决?
如果不供,就放他出去,其他团伙 可能就会认为是他做25仔
5. 弱者一方如果没有筹码,则无效果
但某一方可能怀有赌徒心理,认定自己更强大, 采取背叛的策略能占便宜。
结果: 出现背叛者——零和效应,负和效应
案例:韩一良宁可叫皇帝撤掉自己的官职,断送了自己的前程.甚至顶着被治罪的风险,硬是不肯告发那些向他送礼行贿的人,他背后必定有强大的支撑力量。这是一种什么力量々难道只是怕得罪人?作为给事中,检举起诉和得罪人乃是他的分内事。
启示
因此,恐怕还是一种外在规则的压力,或者说 外在规则在其内心中形成的“道德”在起作用, 使其坚决不肯背叛向他行贿的人。
机制惩罚没有遵守道德的人
6. 有限次的囚徒困境
因为次数有限,因为下次就不再遵守
当临近博弈的终点时,采取不合作策略的可能性加大。
即使参与人以前的所有策略均为合作策略,
如果被告知下一次博弈是最后一次,那么肯定采取不合作的策略
一旦再也没有机会可以进行惩罚, 合作就会告终
在一个反复进行有限次的囚徒困境博弈里,他们会从一开始就作弊。 这会使其他参与者很快看清楚其本质.并对之加以提防
对策!!!!!
避免此现象的出现
1. 不可避免的结论:既然没有办法影响这个博弈的最后一步,那么,在考虑对策的时候,倒数第二步实际上就会成为最后一步。而在这一步.作弊再次成为优势策略。理由是,位于倒数第二的这一步对最后阶段的策略选择毫无影响。
2. 因此.倒数第二步可以视为孤立阶段,单独进行考虑
3. 现在,最后两个阶段的情形已经确定。早期进行合作根本无从实现.因为两个参与者已经决心在最后两个阶段作弊。这么一来,在考虑对策的时候,倒数第三步实际上就会成为最后一步。
4. 优势策略:遵循同样的推理,作弊仍是一种优势策略
5. 但现实中
a. 在现实里.真实的博弈只会反复进行有限次.没有人知道博弈的具体次数。 既然不存在一个确定的结束时间.那么这种合作关系就有机会继续下去,实现阶段性的成功合作。要想避免信任瓦解.
如:部队退伍最后的状况
b. !!!!!!!!!千万不能让任何确定无疑的最后一轮出现在视野所及的地方。
c. 只要仍然存在继续合作的机会,背叛就会被抑制。
d. 博弈者会决于现在与将来相比哪一个更重要
e. 大多数人
合作一段时闯将会带来实实在在的好处。而且其他参与者也会打算仿效他的善良做法,换取这些好处,从而带来合作的收益。
当然,他和其他参与者一样,仍然打算在博弈接近尾声的时候偷偷作弊。
6. 若无采取对策
一报还一报: 出来混迟早要还的
它们也通过多次的交手树立了或好或差的声誉
7. 囚徒困境的特殊情况
囚徒困境: 自愿坐牢的嫌疑人
辩诉交易
又称辩诉协商或者辩诉协议,是指检察官和辩护律师在法院开庭审判之前,对被告人的定罪和量刑问题进行协商和讨价还价,
检察官通过降低指控或者向法官提出减轻量刑的建议.来换取被告人做有罪答辩的一种活动。
不背叛就会被淘汰
在人们的预期中,往往先假定别人绝对会服从
这样为了自己的利益最大化.也只能选择服从。
8. 重复的囚徒困境”
但它必须符合以下定律:
按照你希望别人对你的方式来对别人
但只有他们也按同样方式行事才行。
比如无偿馈赠,也通过某些间接方式, 比如社会声誉的获得,得到了回报。
发现合作的必要条件
第一。关系要持续
一次性的或有限次的博弈中,对局者是没有合作动机的;
第二,对对方的行为要做出回报
一个永远背叛的对局者是不会有人跟他合作的。
如何建立?
那么,如何提高合作性呢? (1)要建立持久的关系。即使是爱情,也需要建立婚姻契约以维持双方的合作。 (2)增强识别对方行动的能力。如果不清楚对方是合作还是不合作。 就没法回报他了。 (3)要维持声誉。说要报复就一定要做到,人家才知道你是不好欺负的,才不敢不与你合作。 (4)能够分步完成的对局,不要一次完成 以维持长久关系。比如,贸易、谈判都要分步进行,以促使对方采取合作态度。 (5)不要嫉妒人家的成功。一报还一报正是这样的典范。 (6)不要首先背叛,以免担上罪魁祸首的道德压力。 (7)不仅对背叛要回报,对合作也要做出回报。 (8)不要耍小聪明,占人家便宜。“吃小亏占大便宜”
9. 爱情博弈
理想状态
胜利将总是属于那些采取善意、宽容、强硬和简单明了策略的恋人们。 反之,恶意的、尖刻的、软弱的、复杂的恋人们往往会两败俱伤。
报还一报:出来混迟早要还的
以道德报德,以公正报怨
获得幸福爱情的博弈原则
善意而不是恶意地对待恋人
宽容而不是尖刻地对待恋人
强硬而不是软弱地对待恋人
就是要在我永远爱你的前提下. 做到有爱必报,有恨也必报;
比如对恋人与其他异性的亲热行为, 要有极其强烈的敏感与斩钉截铁的回报。
当发现对方一直在合作,它就突然来个不合作;
如果对方立刻报复它,它就恢复合作.
如果对方仍然合作.它就继续背叛
简单明了而不是山环水绕地对待恋人
明晰的个性、简练的作风和坦诚的 态度倒是制胜的要诀。
要让恋人明白你说的是什么. 切忌让对方猜来猜去的,造成误会
结论
(1)试错。
人们在对待周围环境时,起初不知道该怎么做, 于是就试试
(3)学习。
比赛过程就是对手相互学习的过程, 一报还一报的策略好,有人愿意学
10. 进化中的路径依赖力
人一旦确定了一种选择,会产生惯性
这种初始选择本身也 就具有发展的惯性
具有自我积累放大效应,从而不断强化自己
稳脚跟,逐步扩张自己的地盘
先有一点点
后慢慢扩张
超速博弈
一个司机的选择会与其他 所有司机发生互动
提高门槛的高度.相当于对底座矮车进行的一 种惩罚,而为高车提供的一种便利。
很多人之所以急于改变,其实是出于一种 自卑与近视
在人们的生活中,存在着种种惯例
支配官场
支配官僚集团行为的东西, “经常与他们宣称遵循的那些原则相去甚远。
真正支配这个集团行为的东西,在更 大的程度上是非常现实的利害计算。
这种利害计算的结果和趋利避害的抉择
假如发现对手打算采取一种行动.而这种行动方针并非随机混合策略,那你就可以出其不意利用这一点占他的便宜。
成名发财都要趁早
早日发现自己的潜力并发挥出来, 可以为明天取得成功获得更多的优势
微小优势经过关键过程的级效放大 会产生更大级别的优势累积
优势集中效应
11. 脏脸博弈
I. 应用
拉更多的人参与
信息不对称
劣币驱逐良币效应
II. 案例
假定的条件是这两歹徒同样聪明、理性、自私自利的,同时想到:“我必须干掉对方,这个时候我能够独吞这笔巨款。
我知道对方怎么想
这就是双方的共同知识
没有共同知识的博弈,会给整个社会 无端增加许多交易成本
再比如一个女孩面对好几个追求的男生.这些男生的人品、上进心等信息对于这个女孩来说都是私有信息.女孩与追求者之间存在着信息不对称的现象,
因此这个女孩到底选择哪一个男生 往往就带有很大的不确定性
包装术盛行的今天,这种不确定性 所带来的风险是不言而喻
主观不确定性和客观不确定性
这件事情就越具有不确定性;结果越不明确, 不确定性的存在就越显著。 最扣人心弦的不确定性,可以称为悬念。
III. 我们无法掌握影响未来的因素 做确定性的决策变得困难
信息的搜取有可能增加决策者的收益, 用获取信息后可能增加的收益来衡量
信息的把握和传递是至关重要
在社会交际中的一个普遍困境: 如何把信息披露给应该得到它的人 才能产生最好的效果’
IV. 安排信息披露方式的原则?
I. 坏消息同时宣布给别人
II. 如果你有几个好消息要公布, 应该把几个好消息分开公布
12. 囚徒困境
I. 意思
i. 被迫使对方做出难以置信的选择
ii. 囚徒定律”基本精神——背叛。
无论对方做出什么样的策略选择
背叛对方(同时也是背叛自己曾经发过的誓言
都能够让自己获得收益, 那么必然要选择背叛这一道路。
iii. 为何形成囚徒困境的机制?
担心自己成为傻瓜
没有什么十全十美的好办法能让自己从困境中逃脱. 同时又能获得利益,只能尽量做到自己不受侵害
II. 现实中的运用
1. 两个共同偷窃的犯罪嫌疑人
I. 甲和乙被带进警察局警方对两名犯罪嫌疑人实行隔离关押.隔离审讯
II. 嫌疑人都无法观察到同伴的选择,警方怀疑他们作案,但手中并没有掌握确凿证据
III. 于是明确地分别告知两名犯罪嫌疑人:对他们犯罪事实的认定及相应的量刑完全取决于他们自己的供认
IV. 三个可能出现的结果!!
1.如果其中一方与警方合作,供认偷窃之事.而对方抵赖.供认打将不受惩罚,无罪释放.另一方则会被判重刑10年;
2.如果双方都与警方合作共同供认,各被判刑5年;
3.而如果双方均不认罪.因为警察找不到其他证据.
V. 但对于嫌疑人:
1. 供认
a. 完全承认
b. 供认一半
对方为主犯
2. 不供认
双方默契不足
VI. 但是!
i. 是否招供并非定罪的充分、必要条件,定罪的充要条件是证据,有了证据不招供亦可定罪,没有证据即使招供(证言),也不能定罪。”
ii. 占优条件
对于同样的两人来讲
甲或乙选择
供出实话
最优选择
可以减刑一半或完全不用
参与人采用优势策略时. 无论对方采取任何策略 总能够显示出优势
2. 民警与吸毒仔的矛盾
i. 在天才的黎巴嫩作家纪伯伦一篇题为《魔鬼》的作品中,一位名叫胡里·赛姆昂的博学之士每天奔波于黎巴嫩北部山村中,教村民们摆脱魔鬼的纠缠。他与魔鬼日夜搏斗,从来不知厌倦。
ii. 然而,有一天他路遇受了重伤而奄奄一息的魔鬼,却“卷起袖子,把长袍塞进腰里”,把魔鬼背回家去救治。原因就在于魔鬼对他说了这样的话:“我是永恒的魔鬼,我是万恶之源。但是罪孽灭绝了,同罪恶搏斗的人也就不见了。你也将随之失业,你的子子孙孙、你的同事友人也将销声匿迹。难道你愿意以我的死亡来换取罪孽的消亡
iii. 这个故事对于那些立志铲除世上一切罪恶的人是一个讽刺,同时也揭示了那些准备把对手全部消灭的人的矛盾与尴尬。对于这一点,中国人用自己的语言简单地总结出四个字——兔死狗烹。
iv. 反映
狡兔死,走狗烹。禽鸟尽,良弓藏。敌国灭,谋臣亡
做事不能做的太尽,保留自己最好方法就是做到最后卡壳,不解决问题
3. 伍子胥与斥候的故事
1. 在逃亡中,伍子胥在边境上被守关的斥候抓住了。斥候对他说:“你是逃犯.必须将你抓去面见楚王!”伍子说:“楚王确实正在抓我。但是你知道楚王为什么要抓我吗?是因为有人跟楚王说.我有一颗宝珠。楚王一心想得到我的宝珠,可我的宝珠已经丢失了。楚王不相信,以为我在欺骗他。我没有办法了.只好逃跑。
2. 是你会怎么讲?
现在你抓住了我,还要把我交给楚王。那我将在楚王面前说是你夺去了我的宝珠,并吞到肚子里去了。-----这句话就和利剑一样
3. 楚王为了得到宝球就一定会先把你杀掉.并且还会剖开你的肚子,把你的肠子一寸一寸地剪断来寻找宝珠。这样我活不成,而你会死得更惨。”斥候信以为真.非常恐惧,赶紧把伍子胥放了:伍子胥终于逃出了楚国。
4. 在绝对劣势的情况下
伍子胥是处于一种绝对的劣势地位。要想改善这一局面,必须采取一个宝宦略。伍子胥的威胁行动,就是抢占先机,宣布自己将无条件地进行报复、这就使原本同时出招的博弈变成相继出招的博弈
无条件的报复
4. 在面临有权势的上司时
巴结
升迁
不巴结
没机会
III. 其他
人们对于潜在的危机
人们总是抱着“宁可信其有,不可信其无”的态度,这是一种预期的支付
但这种危机预期支付心理,恰恰给了处于显性困境者 以机会,或用欺骗方式,或夸大其词
面对这种情况解决方式
理性选择
倒霉原因:太聪明
I. 失败不是因为人们太傻, 而恰恰是太精明所致
II. 生活的模型
I. 两个旅行者从一个出产细瓷花瓶的地方回来,都买了花瓶。可是提取行李的时候.发现花瓶被摔坏了。于是,他们向航空公司索赔。航空公司知道花瓶的价格总在八九十元上下浮动,但是不知道两位旅客买的确切价格是多少。
II. 如何解决呢?
13. 零和博弈
一人的胜利要求另一人失败的事实.并不能使这个博弈变成零和博弈。
零和博弈不可能出现所有人都得到更好结果的情况。
但在这个例子中却有可能。收益范围来自减少投人。
使自己参与博弈的代价尽可能减少,而使收益最大化。
14. 典型的动态群体博弈问题
1. 前提条件还做了如下限制
每一个参与者面临的信息只是以前去酒吧的人数
因此只能根据以前的历史数据归纳出此次行动的策略
没有其他的信息可以参考.他们之间也没有信息交流
2. 分析
一个人要做出正确的预测,必须知道其他人如何做出预测
一般都是用归纳法
预测是一个非线性的过程
3. “少数人博奔”
最简单的模型是:失火时面对两个门.你将如何选择人数可能较少的生门,在这个模型中你的选择决定了你的生与死
4. 混沌系统中的黄金人垃圾股
股市只有作为一个无法准确预测的混沌系统,才有存在的可能.也才能让那些无法预测到其他参与者策略的股民们,在“博傻”过程中赚钱。
在“博傻”过程中赚钱
5. 启示
I. 变化往往是不可预测的
II. 无法预测的过程中也可以采取恰当的策略
III. 少数者策略是值得我们重点关注的
IV. 未经协调的选择之间相互影响,达成让全体参与者一致感到遗憾的结果
V. 每一个相关对象的偶然性因素,都包含了对象必然发展的结果的信息
6. “蚂蚁效应”
I. 一群蚂蚁选择了一棵百年老树的树基安营扎寨。为建设家园.蚂蚁们辛勤工作,挪移一粒粒泥沙,又咬去一点点树皮…·有一天,一阵微风吹来,百年老树轰然溃倒,逐渐腐烂,乃至最终零落成泥。
II. 若一个人能毫不懈怠地每天阅读500字的文章,他有朝一日就能成为博学之士
III. 一个组织的奋起,也许就是开始于一个员工敲开一扇普通的门
IV. 千万不要轻视了细微的力量,而且更要坚持将一丝一毫的力量积累成最后的成功!
15. “少数派策略”。
I. 由于资源是有限的,在一个社会中只有这一部分少数者才能充分享有。
如何成为小部分人?
I. 收集他们得信息
II. 学习他们得路线
III. 跟随他们的行为
II. 在生活中我们也可以发现,往往是那些与大众不同的少数者,能够顺风顺水地改变命运。
III. 真正的少数者总是在条件还没有齐全的时候就已经向胜利出发了
他们会想尽一切办法去创造自己所需要的条件,
IV. 而不是像其他多数人一样,等已经有人出发了,才开始想是不是时机成熟了。
V. 少数派策略------是一种“以患为利”的智慧
VI. 因为资源都是有限的,如果没有少数派策略,所有人争夺的焦点都在有限的几种物事上,那么每个人面临的处境都是十分艰难的。
VII. 唯有另辟蹊径.找到多数人没有注意到的那个“生门”.才有可能绝处逢生,甚至获得比那挤上独木桥的千军万马更高的收益。
VIII. 另辟蹊径
跳出人云亦云、人求亦求的怪圈====改变以自己的需求为中心的传统想法,
IX. 在多人博弈中常常由于复杂关系的存在,而导致出人意料的结局。一位参与者最后能否胜出,不仅仅取决于自己的实力,更取决于实力对比关系以及各方的策略。
X. 每个人必须设想一下若是自己处在其他人的位置,会做出什么反应,从而预计自己这一步会带来什么结果。他选择的最佳策略也是这一全盘考虑的一个组成部分。
XI. 无论是对方采取何种策略,均应采取自己的最优策略。
采用概率论
XII. 在每个参与者都有优势策略的情况下,优势策略均衡是非常合乎逻辑的。但遗憾的是,在大多数博弈中,优势策略均衡是不存在的。 有时候,某参与者有一个优势策略,其他参与者则没有。
16. 关于思考的几个问题
前提
三枪手混战,互相知道对方实力
枪手甲枪法精准,十发八中;枪手乙枪法不错.十发六中;枪手丙枪法拙劣.十发四中。
问题一
假如三人同时开枪,谁活下来的机会大一些?
答案一
最可能活下来的是丙
那么作为枪手甲.他一定要对枪手乙开枪。这是他的最佳策略
问题二
三个人轮流开枪,谁的机会更大
答案二
丙的运气都好于他的实力。至少,他不会被第一枪打死。而且,他很可能有在第二轮首先开枪的便宜。
例如,顺序是甲、乙、丙,甲一枪干掉了乙,现在,就论到丙开枪了——尽管枪法不怎么样,但这个便宜还是很大的:那意味着他将近一半的机会赢得这次决斗(毕竟甲也不是百发百中k如果乙幸运地躲过了甲的攻击呢?他一定要回击甲,这样即使他成功.下一轮还是轮到丙开枪,自然,他的成功概率就更大了。
问题三
如果三人中首先开枪的是丙,,他的最优策略是什么?
答案三
丙的最佳策略是乱开一枪!只要他不打中任何人.不破坏这个局面,他就总是有利可图的
17. 在股市上的群体博弈
I. 例如
1. 每一位股民都在猜测其他股民的行为,并努力与大多数股民不同
II. 如果多数股民处于“卖”股票的位置,而你处于“买”的位置,你买人的价格低,你就是赢家
III. 而当你处于少数的“卖”股票的位置,多数人想“买”股票.那么你持有的股票就能以高价卖出,你将获利。
IV. 猜测
1. 而当你处于少数的“卖”股票的位置,多数人想“买”股票.那么你持有的股票就能以高价卖出,你将获利。
1. 优质股
2. 逢低吸收
3. 借鉴
4. 观看财报,预测方向
18. 隔岸观火
1. “坐山观虎斗,趴桥看水流”
2. 如果面对不止一个敌人的时候,切切不可操之过急,免得反而促成他们暂时联手来对付你
3. 在多方对战的时候,最关键的并不在于先击倒哪个对手.而是要先保全自己
4. 同时行动的博弈的法则,即:假如你有一个优势策略.请照办。不要考虑你的对手会怎么做。
5. 假如你没有一个优势策略,但你的对手有,那么就假定他会采用这个优势策珞,相应选择你自己最好的做法
19. 天道
I. 道是勤奋。天道酬勤
II. 至纯至善非为道
1. 即使痛失所爱到吐血还是该干嘛干嘛。格局不是一点差异
2. 世界并没救世主,能救自己的还是自己,而按照客观规律去办事的多数就会成功
3. 学会向内求,努力种因,不停地增加自己和智慧和德行,到达一定境界时,功名利禄自然会围着我们转。
4. 反之,不努力种因,机会来了,我们也承载不了。