导图社区 《博弈论基础》
对博弈有更深的理解,建立起基于博弈的新思维。了解博弈的基础知识和分析方法,应用博弈论理解和分析社会现象
编辑于2022-12-02 18:33:04 河南这是一篇关于神秘的西夏的思维导图,《神秘的西夏》以近些年对西夏学的最新研究成果为基础,以西夏王朝从兴起到灭亡的发展过程为历史线索,运用当今最先进的电视表现手段,对西夏的历史文化做了一次最全面、最综合的展现。该片不仅揭示了西夏王朝的兴衰历程,还深入探讨了西夏的文化、艺术、科技等多个方面,为观众呈现了一个立体、生动的西夏形象。主要内容包括:文明之光,生生不息,铭记,普通人的王朝,后宫丽影,以战求生,大白高国,崛起之路,高原的孩子,失落的国度。
中国古建筑史上的传奇家族,八代人,历经200余年,从事皇家工程建设。这个家族源自江西省九江市永修县梅棠镇新庄村,自清初起累世供职清廷样式房,主持、参与皇家各类建筑工程,创造了众多著名的文化遗产建筑。
这是一篇关于中国通史1的思维导图,《中国通史》是一部详尽叙述中国历史的大型著作,其第一部涵盖了从中华文明的起源到特定历史时期的内容。该书以丰富的历史资料为基础,充分吸收当代考古和史学研究的最新成果。以严谨科学的态度、宏阔的视野回顾中国历史的发展道路,探索中国历史的大脉络、大趋势、大线索、大走向、大波折。
社区模板帮助中心,点此进入>>
这是一篇关于神秘的西夏的思维导图,《神秘的西夏》以近些年对西夏学的最新研究成果为基础,以西夏王朝从兴起到灭亡的发展过程为历史线索,运用当今最先进的电视表现手段,对西夏的历史文化做了一次最全面、最综合的展现。该片不仅揭示了西夏王朝的兴衰历程,还深入探讨了西夏的文化、艺术、科技等多个方面,为观众呈现了一个立体、生动的西夏形象。主要内容包括:文明之光,生生不息,铭记,普通人的王朝,后宫丽影,以战求生,大白高国,崛起之路,高原的孩子,失落的国度。
中国古建筑史上的传奇家族,八代人,历经200余年,从事皇家工程建设。这个家族源自江西省九江市永修县梅棠镇新庄村,自清初起累世供职清廷样式房,主持、参与皇家各类建筑工程,创造了众多著名的文化遗产建筑。
这是一篇关于中国通史1的思维导图,《中国通史》是一部详尽叙述中国历史的大型著作,其第一部涵盖了从中华文明的起源到特定历史时期的内容。该书以丰富的历史资料为基础,充分吸收当代考古和史学研究的最新成果。以严谨科学的态度、宏阔的视野回顾中国历史的发展道路,探索中国历史的大脉络、大趋势、大线索、大走向、大波折。
《博弈论基础》 浙江大学 蒋文华
概述
何为“博弈”
博
博览全局
弈
对弈棋局
谋定而动
博弈
在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),已实现利益最大化的过程。
核心
整体思维基础上的理性换位思考,用他人的得益去推测他人的策略(行动),从而选择最有利于自己的策略(行动)。
站在别人的立场上想一想,就是为自己未来的遭遇想一想
故事
两人打猎,遇一猛狮,一人卸下装备,同伴不解,汝能胜狮?答曰,非需胜狮,只需胜汝
要点
1
搞清你的对手是谁
未来的对手是谁
中国移动的对手不是联通和电信,而是微信
不是和狮子比,而是和同伴比
2
如果狮子聪明,先吃跑的快的,跑的快的的能吃到,跑的慢的肯定能吃到
先驱
先驱就是牺牲
3
两个人往相反的方向跑,都被吃到的可能性就小
企业差异化战略
涉足多个行业,分散单一产品的经营风险
4
狮子比较弱小
两人合作把狮子打死
你的行为选择既跟你的对手有关,又和你的外部环境的变化有关,由此作出对自己最有利的选择。
博弈时
既可以竞争
也可以合作
关键在于利益是否一致
利益一致合作
利益对立竞争
要点
博弈时首先学会换位思考
只需领先一步,高人一筹
领先太多就容易成为先驱
博弈
你中有我,我中有你,
直接相互作用
得益
不仅取决于自己的策略,还取决于所有参与者的策略
如果对方眼中的你是傻子,对方更愿意与你合作,何乐而不为呢?
不要在一个充分竞争的市场里追求成功
选对市场(对手)比选对策略更重要
在博弈之前
博弈就已经开始了
看清楚方向、人,再去博弈
先选对市场
市场在那里对手就在那里
理解
中国理解
博+弈=下围棋
略观围棋,法于用兵,怯者无功,贪者则亡
博弈是求胜的,胜负之心很重
打仗
灭了对方
否则被对方所灭
西方
game
一个游戏
玩的开心很重要
公平不公平
学完后
由术变道
学习博弈论的收益
当局者清
更有利的选择
更快速的反应
旁观者更清
理解历史与现实
预测未来的发展
提出完善游戏规则(制度)更好的建议
博弈的目的
单赢的博弈
双赢的博弈
发展简史
古诺模型
参与博弈的双方以各自在同一时间内的相互独立的产量作为决策的变量,是一个产量竞争模型
伯川德模型
与古诺模型最大的不同是
企业把产品的价格而不是产量作为竞争的手段和决策的变量,通过定制一个最优的销售价格来实现利润的最大化,
价格战
双方可能受益都是零或负值
斯塔尔克伯格模型
分析市场竞争
企业A先决定一个产量,企业B根据所观察到的产量,并根据所观察到的产量来决定自己的产量
动态博弈模型
根据前者的发展决定自己的发展
理论的诞生和发展
20世纪40年代的社会变化有关
市场竞争从充分竞争向垄断竞争发展
“二战”催生了博弈论的发展
后来的发展方向
纳什均衡的弱化(或一般化)
纳什均衡的精炼(筛选)
博弈论基本假设的研究
对博弈论应用的研究
奥曼从数学角度,谢林从经济学角度用博弈论重塑了对人类社会相互行为影响的分析框架
术语解释
参与人
理性选择的主体
信息
参与者有关博弈的知识
行动
参与者能够选择的变量
策略
核心
参与者在行动之前所准备好的完整的行动方案(预案)
在什么情况下要怎么做
完整性
多样性
不可观察性
收到信息
通过策略
快速动作
作用
让我们建立起从信息到行动的快速反应机制,从而能够以最快的速度做出行动选择
好的预案
信息分类
责任到人
具体措施
时效性
损益
参与者的得失
结局
所有参与者各自选择策略博弈后的结果
均衡
所有参与者的最优策略组合
博弈的规则
参与者、行动和结果合起来成为博弈的规则
谁有资格参与游戏
什么行动能做,什么不能做
博弈论
研究人们如何做策略(行动)选择及其最后的均衡结果会是什么的理论
博弈的分类
1
合作博弈
参与者可以达成一种具有约束力的协议,在协议的范围内选择有利与双方的策略
非合作协议
参与者无法达成这一种协议
2
静态博弈
博弈中参与者同时选择,或非同时选择时,在逻辑上是同时的
投暗标,出价后同时亮标
动态博弈
参与者的行动有先后顺序,且后行动的人能观察到先行动者的行动
竞拍
3
完全信息博弈
每个参与者对其他参与者的类型,策略空间及损益函数都有准确的信息
不完全信息博弈
总有一些信息不是所有参与者都知道的
4
零和博弈
博弈前的损益总和与博弈后的损益总和相等
非零和博弈
博弈后的损益总和大于或小于博弈前的损益总和
正和或负和
不玩负和游戏,少玩零和游戏,多万正和游戏
双方都可以获益的才是最好的
如何在博弈中实现利益最大化
什么是博弈
博弈总的两种
单赢的博弈
竞争
双赢的博弈
合作
市场经济
通过卖方之间(买方之间)的竞争,实现买卖双方的合作
市场博弈
比的是谁能和客户建立更持久的合作关系
如何在竞争博弈中实现利益最大化
先下手为强,后下手遭殃
竞争博弈,领先一步,高人一筹
比速度,比能力
竞争博弈三个核心问题
比什么(规则)
未来人与人之间到底比什么?
规则
拍卖
加高者得
竞选
票多者得
成绩
实力+运气
抢夺
力大者得
摇号
运气好者得
彩票比运气,不建议
游戏规则决定了你的能力发展方向
如果你有极大的力量,那么你就来制定游戏规则
如果你有较大的力量,选择适合你的游戏规则
如果你缺乏足够的力量,你就适应游戏规则
适应不了就被淘汰了
和谁比(对手)
怎么比(策略)
竞争
为何竞争
资源稀缺,竞争不可避免
谨防过度竞争
学会及时止损
只有一个赢家,赢者通吃的竞争博弈
存量绑架
投入过多不想放弃
目标偏移
竞争中目标发生变化
学会止损
竞争博弈中及时止损很重要
过度竞争会损害未来的竞争力
运动员过度竞争损害运动员身体,退役后身体不如普通人
竞争意识转变为成长意识
竞争意识
关注对方的优势,模仿对方的长处
成长意识
关注自己的优势,发挥自身的长处
利益最大化
定规则
扬长避短
定方向
聚焦聚能
定对手
以强胜弱
定策略
止盈止损
如何在合作博弈中实现利益的最大化
合作
两人合伙猎鹿各得4,合伙猎兔各得2,单人猎兔得2,单人猎鹿得0
双方选择猎鹿是最优结果,A选择猎鹿的前提是他认为B也会去猎鹿,B也同样如此,只有双方都去猎鹿成为共同知识前提下才会出现最优的结果
没有沟通的情况下,猎鹿的概率是50%,每个人猎鹿的收益期望值就是2,出于规避风险的考虑,会选择独自猎兔,考虑到这一点后,双方同时选择猎鹿就不可能了
为了得到更好的结果,出发前商量好一起去猎鹿,猎鹿就变成了一个均衡的结果,此时没有人愿意偏离这个结果而选择去猎兔
沟通有成本,每人承担的成本小于2(总成本小于4),那么提前沟通能够提高双方总的收益水平,反之还不如分头去猎兔
合作需要沟通和协调的,沟通和协调成本太高的话,合作很难成功
合作博弈的核心问题
合作的新增收益怎么分配
如果A猎兔得4,B猎兔得2,那么合作后B收益增加,A收益不变,A可能不会选择猎鹿
合作的风险怎么分配
没有猎到鹿,猎到的价值少于每人得4,怎么分配
合作的三种收益分配
A剩余B固定
雇主和雇员
A固定B剩余
银行和企业
约定一个固定比列
分成制,股份制,婚后财产平分制
争抢蛋糕叫竞争
非生产性努力
做大蛋糕叫合作
生产性努力
把非生产性努力(争抢蛋糕)转化成生产性努力(做大蛋糕)的关键在于蛋糕没做成前约定好怎么分
为了保证合作博弈的双赢结果,必须确保参与者有自由的退出权
利益最大化
贡献越大,收益越大
机会越多,收益越大
沟通越易,收益越大
做事越稳,收益越大
未来的努力方向
从竞争意识转化为成长意识
从竞争能力转化为合作能力
博弈的最高境界
双赢
持久的
单赢你总有被打败的时候
把与别人竞争的时间用在自己的成长上面,这才是持久的
基本假设
重要假设
人的理性
假设博弈中人是理性的
疯子在博弈中的行为是不可以测的
认知的理性
自我清晰的判断力
博弈中的什么是想要的或更想要的
博弈中的两个事物的偏好是完备的
人是自我价值的判断者
偏好的完备性
两个事物A/B
喜欢A多过喜欢B
喜欢B多过喜欢A
A/B都喜欢
A/B都不喜欢
偏好的传递性
喜欢A多过B,喜欢B多过C
推出
喜欢A多过C
个人的偏好具有传递性,群体未必
中庸之道
A和B都喜欢
出现一个C
C是A和B各占一半
会选C
激励别人要综合激励
行为的理性
博弈中追求自我利益的最大化
两利相权取其重
两害相权取其轻
好不好是比较出来的
比较就有参照
参照要掌握在自己的手里
参照物会影响你的判断
消费者追求的不是便宜,而是占便宜
选择时有比较,不同的参照有不同的比较,有不同的结果
499/501
实际差别不大,但给人的感觉差别很大,一个不到500,一个500多
涨价是占我们的便宜,不打折是不让我们占便宜
不一样
如果不给对方您的两利让其相权,那对方就会把您的一利和他人的一利相权,最后离你而去。
给对方两个有明显区别东西,一个价高一个价低,让对方选择,而不是给对方一个东西,让他去和自己曾今见到过的相差无几的东西去比较。
让对方多做选择题,少做判断题
让对方在2到3个中选择,选项不要太多
选项要有明显的区别
博弈中愿意吃亏,与那些比你更愿意吃亏的人做朋友
能过建立更好的、更长久的合作关系
共同知识假设
参与者在无穷递归意识上都知道的事实
每个人都知道事件E,每个人知道每个人都知道事件E,每个人知道每个人知道每个人知道事件E,一直无穷层次
达成共识是一件很难的事情
信息不对称的情况下,博弈的结果不是取决于大家是怎么想的,而是取决于大家认为大家是怎么想的。
囚犯困境
原因
来源
两人偷盗,被抓,关于是不是初犯,坦白还是抗拒?
对A来讲
对方抗拒
我坦白,收益为0
对方坦白
我坦白,收益为-3
无论对方是坦白还是抗拒,A选择坦白都是最优解
更重要的是B也会这样想
攻守同盟
商量好共同抗拒
获得最小损失
建立攻守同盟有用么
没用
对方仍有两种选择
遵守同盟
不遵守同盟
对方遵守,我最好是不遵守,没有损失 0
对方不遵守,我更不能遵守,损失-3
不管对方遵守不遵守,我不遵守才是最优解
真的是初犯
会不会有人撒谎不是初犯,以获得自己坦白而对方抗拒的结果
以此来减少损失
有可能
游戏规则决定了游戏结局
说谎有利,大家就都说谎
浮夸风,亩产三万斤
人为什么偷懒?偷懒的收益是你独享的,偷懒的代价是大家承担的
一般条件下的囚犯困境
双方都有占优策略
背叛能获得更好的收益
存在一个合作解,使双方收益大于各自的占优策略的均衡结果
均衡的结果不是最优结果
困境的原因
大家都想少损失,选择坦白,结果都损失多了。
大家都选择抗拒,结果损失少了
追求自己的最优策略
这种情况就没有囚犯困境了
例子
我赚1块,对方损失10块 对方赚1块,我损失10块
大家都损失九块
我赚10块,对方损失1块 对方赚10块,我损失1块
大家都赚九块
为自己挣得利益的同时让他人损失的更多,才是囚犯困境
真正的原因
表面上看囚犯追求自己利益是导致囚犯困境的原因,而实际上是囚犯追求自己利益的同时,是以更多损害他人利益为代价
真正原因
私人成本与社会成本的差异,即个人的行为的负外部性
损人利己和损己利人是一个硬币的正反两面,问题的关键是,损失的部分和得利的部分哪个是更多的
如果有一种制度,在该制度下,人们只能通过利他才能利己,那么这种制度一定是好的制度(市场的逻辑)
真实世界的囚犯困境
经济大萧条
凯恩斯对市场萧条的解释
消费需求不足
投资需求不足
价格刚性
人对损失的敏感度远远大于收益的敏感度
价格战
只要价格战,企业就没有了利润
攻守同盟也没用
独裁与多数人的懦弱
恶人的恶是被善良的懦弱人纵容的
民主与多数人的暴政
民主必须与法治(不是法制)相辅相成,才能够避免多数人的灾难
法制
法律规定,用来管理平民都规则
法治
最高规则,所有人都遵守
如何破解囚犯困境
原因
个人成本和社会成本的巨大差异
方法
货比三家
分而治之
道德教化
社会学基本定理
金迪斯
如果一个社会全都是自利主义者构成,那么这个社会终将消亡,如果一个社会通过“说服教育”或说教的机构的努力,让社会保持一定比例的利他主义者,那么这个社会才会一直稳定运行下去
财产私有(制度建设)
让个人成本和社会成本相依存
圈地运动
公共牧地沙漠化
过度放牧的收益是自己的
沙漠化的损失是大家的
人民公社
偷懒的损失是大家的
偷懒的收益是自己的
偷懒是占优策略
土地承包
偷懒损失都是自己的
温故而知新
历史告诉未来(重复博弈)
通过历史灾难告诉未来怎么避免灾难
万元陷阱和智猪博弈
人类扑杀动物所设的陷阱有三个特征
有一个明显的诱饵
通往诱饵的路是单向的,可进不可出
越想挣脱,就越陷越深
万元陷阱
竞拍1万元,每次加价100元,出价最高者以所出价格买下1万元,出价第二高者的钱归卖主所得
当第二高的出价低于一万元,他会想着加钱,这样就会获得收益。
当第二高的价格高于一万元,他仍会想着加钱,成为出价最高者会减少自己的损失损失。
从利益角度考虑,这个游戏一旦开始就无法停止,出价第二高的人总想成为出价最高者以此获得收益减少损失。除非有人破产出不起价格
只要有沉沉没成本的地方,就会有万元陷阱
你的投入不是最高的,就会变成你的损失
为了减少损失,不停增加投入
沉没成本效应/路径依赖
投资已经过半,改变投资方向和暂停投资都是很困难的事情
出价第二高者都价格就是沉没成本
掉入万元陷阱的动机
心理学家泰格
经济(理性)的
渴望赢得钞票
赢回损失
避免更多损失
非经济(感性)的
为了面子
证明自己是最好的玩家
惩罚对手
游戏里的各种装备
各种升级需要花钱
越稀有的装备需要越多的钱
装备越好越厉害
双方为了获得更高的战力而不断投入金钱
如何避免
做任何一件事情,确立投入的极限及预先约定
投入多少时间
投入多少金钱
极限一旦确定,就要坚持到底
止损
自己打定主意,不必看别人
但是止盈容易,止损难
贴现
亏损以后就愿意冒风险了
药家鑫事件
驾车撞倒人,害怕无休止的医药费和索赔,把伤者捅死,最后被判死刑
面对损失的时候,不想看到损失,所以冒一个更大的风险
多数人都有这种想法
既然事情已经发生,那么就坦然接受
每个人都有犯错的时候,请把注意力放在以后如何避同样的错上
推荐书《摇摆 难以抗拒的非理性诱惑》
一个人深感挫败时,就很容易铤而走险
万元陷阱的补充建议
不要指望以很低的价格买入
即使可以用100元竞争一万元,也最好不要这样,很可能被别人出价更高,直接出价9900元,虽然获益少,但别人竞价的可能机会没有。
出价9900元,对方只能出一万,这时即使对方赢了也没得赚,一旦你出10100,那么对方就会亏一万元
在一个可竞争的市场里,你很难有一个持久的暴利
尽快传递“势在必得”的信号
破釜沉舟
让对方主动退出
只争馒头不争气,没有馒头终断气
务实
不要意气用事,博弈是靠实力的
高瞻远瞩,深谋远虑
三思而后行
游戏
两人各带10万,按照之前规则竞拍,你先出价的情况下,会怎么出价
抢点游戏
抢到90100的价格点
10万减去一万加100
对方出更高的价格,我方直接出10万
损失有原来的90100降为9000
对方直接出10万
那么他损失的更多,他之前的价格少于九千
80200/70300/60400/50500/40600/30700/20800/10900
最前面的是1000元
出价1000
对方就不会出价了
对方出价1100
我方出价10900
我方由亏损1000转为亏损900
对方由亏损少于一千变为亏损1100
报价越高亏损越多
抢占成本的最低点,就是抢占竞争的制高点
智猪博弈
多捞不多得
智猪
一个猪圈两只猪,按按钮会获得10个单位的饲料,按按钮消耗2个单位的饲料,先按的后吃饲料
利益分配
大小一起吃
大的吃到7个,小的吃到3个
小的先吃
大的吃到6个,小的吃到4个
大的先吃
大的吃到9个,小的吃到4个
谁来按按钮
以利益最大化为目标
对于大猪
按或等均可
小猪按,大猪等
大猪得9
小猪等,大猪按
大猪得4
对于小猪
只有等才是最优解
大猪按,小猪等
小猪得4
大猪等,小猪也等
小猪得0
小猪按,大猪等
小猪得-1
均衡结果
大猪按,小猪等
扩展
按钮成本A
A≥10
大小猪都不按
6≤A<10
大小猪都选择等待
对整体有利,但是对按按钮的来讲是承担了成本却是负收益
1≤A<6
大猪按,小猪不按
大猪多劳少得也不不得好
A<1
任何一方的收益都大于0
斗鸡博弈
智猪博弈是一个搭便车博弈,一方付出 了相应的代价,双方共享了获得的收益
小猪获得了收益,不要忘了给大猪以回报
富人愿意行善,离不开穷人的点赞
启发
个体理性于集体理性是相一致还是相冲突取决于制度安排(游戏规则)
解决个体理性和集体理性的冲突,不是靠否定个体理性,而是修改制度(游戏规则),从而在满足个体理性的基础上实现集体理性
智猪博弈可以看出
当A<10时,任一方去按都是集体理性的选择,分配的不均将有助于减少个体理性和集体理性的冲突
案例
山寨
复印笔记
网络购物
汽车定位系统
小偷偷了车,被抓,小偷不知道那辆车没装,就不会偷车,那些没装定位系统的车搭了装定位系统的便车
好货不起便宜,便宜没好货
消费者中有人识货,以次充好就会被揭穿
识货的人比列越高,这句话越可以信
识货的人比例越低,这句话越不可信
懦夫博弈与性别战
又称斗鸡博弈(竞争关系)
A-C>0
利润大于损失
对方是老鹰,自己也选老鹰
不管对方选什么,自己都选老鹰是一个纳什均衡
A-C<0
利润小于损失
对方选老鹰,自己选鸽子
对方选鸽子,自己选老鹰
有利润选利润,无利润选损失少的
自己先选,选老鹰,先动优势
对方选老鹰,利润低于成本高
对方选鸽子最起码无损失
先动优势可以让自己获得最大收益
同时选
对方采取老鹰的策略概率是A/C时,自己选哪个都一样
如果A增加
双方采取老鹰的概率就会增加
C增加
采取老鹰的可能性就减小
斗争成本越大,斗争的可能性就越小
在理性的情况下
利润过大,斗争的可能性就越大,
奖励适度
赢者通吃的行业,很容易过度竞争
一个东西很容易低成本制造,容易赢者通吃
互联网
赌博
竞技运动
竞技体育本身就是一个万元陷阱,除非它本身能给你带来真正的快乐
公共物品的提供
特点
非排他的
大家都可以用
如国防,警察
非竞争的
一方的使用不影响对方的使用
谁来提供
囚犯困境
政府提供
智猪博弈
大猪提供
斗鸡博弈
要么对方,要么自己
懦夫博弈
人与人之间的竞争关系
升官发财
找工作
抢市场
停车站位
性别战
模型
要进都进,要退都退
实例分析(合作关系)
约会
恋爱与结婚
聚餐
通讯
语言
扩展
农户的产品选择
规模与合作
少数人种,利润高,人数多,形成规模更好,但超过一定规模就会有相反的结果
休假制度
团聚与旅游
以旅游为目的分开休假
以团聚为目的一起休假
春节
中秋
清明
有效需求
长尾理论,余额宝
选课
容量以外,竞争关系
对方选上,你就选不上
容量以内,合作关系
选的人少,可能就不可这门课了
盲人摸象与知识生产
均衡的存在性和多重性
均衡存在性定理
每一个有限的博弈中,至少存在一个纳什均衡(纯战略的或混合战略的)
在n人纯战略博弈中,每个参与人的纯战略空间是s是欧式空间上一个非空的、闭的,有限的凸集,损益函数u(s)是连续的且对s是拟凹的。那么至少存在一个纯战略的纳什均衡
当出现多个纳什均衡点,哪个在现实中更容易出现
文化
女士优先
老人孩子优先
法律不被信仰,就形同虚设
混合策略与监督博弈
策略
纯策略
如果一种策略要求参与者在每一个给定信息的情况下只选择一种特定的行为
混合策略
如果一个策略要求参与者在给定信息的情况下以某种概率分布随机的选择不同行为
石头、剪刀、布游戏
人是很难随机的出
如果你的剪刀输给了对方的石头,那么下一轮你要出能赢石头的;如果你赢了,那么下一轮你可能仍会出相同的手势
人人容易胜留败走
输家必须做出改变
制胜策略
你赢了,下一轮不能出相同的手势
你输了,下一轮改成可以赢对方上一轮的手势
提前告知你,我出石头,你会出什么?
1/2会出石头
1/6会出剪刀
1/3出布
大致的分布
大部分人会出石头
人在博弈时也不会想太多
一般一到两步
小得失相信人,大得失怀疑人
升级版
多人游戏
用石头赢10元
用剪刀赢20元
用布赢50元
多人同时出,每个人与其他人逐个结算
出那个的概率更高?
出剪子赢得概率最大
只有石头是布的两倍时,剪刀才不会赢
当
石头2
剪刀5
布1
此时谁也不赢
智猪博弈中,当任何一方的收益都大于零时,都有可能
利益冲突的时候需要协调,协调成本过大时,不如不协调
监督博弈
V是雇员的贡献
W是雇员的工资
V>W>H
H是雇员的付出
雇员不偷懒时收益将损失H
C是检查的成本
雇主选择检查时,收益将减少C
F是发现雇员偷懒的惩罚
押金
雇主检查,雇员就不偷懒;雇员不偷懒,雇主就不检查;雇主不检查,雇员就偷懒
雇主
-C+F<-W
不检查
检查损失更大
此时雇员肯定偷懒
-C+F>-W
检查
减少损失
三个问题
求解混合策略纳什均衡
利用均衡理念
达到纳什均衡时,任何一方都不愿改变自己的策略
雇主以检查为β
当T检查=T不检查时是均衡结果
雇员偷懒/不偷懒
当T偷懒=T不偷懒时是均衡结果
根据等式可以求出α、β
结论
H越大,雇主越容易检查
C越大,雇员越容易偷懒
W越大,雇员越少偷懒,雇主越少检查
F越大,雇员越少偷懒,雇主越少检查
雇主检查的概率α
H/(W+F)
雇员偷懒的概率β
C/(W+F)
雇主支付W为多少时,期望收益最大
雇主的期望收益
=W*β+(V-W)*(1-β)
=V-W-V*β
雇员的贡献减去雇员的工作减去雇员可能偷懒带来的损失
=V-W-C(1-C(W+F))
监督成本为零,雇主收益会更大
更可能会检查
雇主支付工资为
雇主期望收益最大
雇员的期望收益
W-H
双方总收益
T总=V-H-VC/(W+F)
工作W
双方总的期望收益是
雇员创造的价值减去损失减去偷懒的损失
推论
雇主的期望收益会随着F的增加而上升
雇员的收益会随着F的增加而减少
总的期望收益和工作W以及押金F多少无关,和雇员创造的价值V和雇员的劳动力成本H以及监督成本C有关
期望的收益就是雇员创造的价值V和劳动成本H的差值分配的问题
监督的成本越小,工资越低
如何理解雇员的押金
子主题
最后通牒与讨价还价
最后通牒
两人分固定数量的钱(100),A提出方案,B表决
B同意,按照方案分
B不同意双方都没钱
要就要,不要拉倒
试验表明
A分给B的钱在40-50之间
很少有超过50的
拒绝的可能性随着钱数的减少而增大
少于20被拒绝的可能性在40%-50%之间
人在博弈时,会追求利益以外的价值
决定你出价高低的是:贪婪和恐惧
给B的钱,尽可能的少,但B会接受
蛋糕越大,给B的比列可以越小
B拒绝的话损失越大
蛋糕越小,给B的比例越接近50%
否则B可能因为不公而拒绝
100块,各50。如果2/8分,对方可能宁愿损失20元
100万就2/8分,B拒绝损失20万
比例低到一定程度时就不要在减少了,否则对方一旦不同意,你损失的更大
过犹不及
贪婪让我们成功,恐惧让我们安全
季军比亚军更开心
序位消费理论
一个人消费满足
不仅仅取决于你消费绝对的量
还取决于你消费相对的量
高考的成绩不重要,排名才重要
排名决定了你能不能进一所大学
困扰我们的不是如何过上幸福的生活,而是如何能够过上比别人更幸福的生活
人与人之间的最根本冲突是价值观的冲突
价值观就是对到底什么是重要的判断
每个人可以有合他人不一样的价值观 但一个国家必须有一个相对统一的价值观
常见例子
一口价/不讲价
自动售货机
没有讨价还价的余地
越成熟的组织,越多使用最后通牒博弈
节省时间成本
给人以公平的感觉
权利的基础
为什么企业里出钱的人说了算而不是出力的人说了算
为什么国家(存)的领导是选出来的
代价由谁承担谁说了算
谁来承担决策的后果,谁就负责做决策
独裁者博弈
与最后通牒的区别
没有B的否决权
纯利己的角度讲
A会分给自己100元,B获得0元
试验表明
自己独占100元的提议只占20%
大于0小于50的提议占80%
大于50的提议没有
与最后通牒相比,独裁者博弈可以获得全部钱,但是很少有人不分给B,
三个道理
人们在进行行动时,不仅考虑经济效益,虽然这是主要的考量,但也会考量一些道德/社会规范/伦理等
己所不欲勿施于人
一个社会如果在制度安排上给老百姓更多可以拒绝的权利,会带来更多的公平性,甚至是效率上的改善
一个社会如果在制度安排上给了机构(官员)更多拒绝的权利,那么拥有审批权的机构(官员)一定能过从中获利丰厚
讨价还价
通过协商来解决利益分配的问题
时间是有成本的
议价或谈判
无限期博弈结果
纳什均衡结果
X1=(1-δ2)/(1-δ1*δ2)
参与者1得到的份额X1
参与者1的贴现因子δ1
参与者2的贴现因子δ2
贴现因子:现在5万元贴现因子为0.6,十年后值3万,
讨价还价要先出价有优势
先动优势
当δ1=δ2=δ时
X1=1/(1-δ)
δ不可能大于1
X1>1/2
δ的大小取决于你考虑的是眼前利益还是长远利益
δ越大,越容易考虑长远
谁更有耐心,谁得到的份额越多
贴现因子
一个份额在经过一段时间后所达到的等同的现在的份额
有参与者的耐心程度决定
影响因素
寿命
越长越看重长远利益
组织相对个人有更长的寿命预期,提高了个人的贴现因子
财富
越多越看重长远利益
未来收益的确定性(法治)
知识水平
越高越看重长远利益
重复博弈和制度建设
重复博弈
同样结构的博弈重复很多次,每次博弈称为“阶段博弈”
特点
前一阶段的博弈不改变后一阶段博弈的结构
所有参与人都能观测到博弈的过去历史
参与人总的收益是所有阶段阶段收益的贴现之和
重复博弈下的囚犯困境
策略选择
雷锋策略
只选合作
曹操策略
只选背叛
冷酷策略
触发策略
第一次选合作,看对方怎选
对方选合作往后就一直合作,直到对方选背叛,此后不管对方怎么选就一直选背叛
对方选背叛就一直选背叛
不给对方改正的机会
心太软策略
给对方一次犯错的机会
一报还一报
收益最高
第一次合作,之后每一次做出对方上一次的选择
四个特点
善良的,第一次博弈选合作
可激怒的
防背叛
宽容的
給改正错误的机会
清晰的
让对方很快清楚你的策略
一报还一报的善良性防止陷入到非合作的麻烦中,对对方背叛的报复则保证了对方背叛行为的谨慎性,宽容性有助于在对方背叛后重新开始合作,简单清晰的规则易于被人理解,从而导出长期的合作
人鬼策略
看对方之前策略怎么做的
总的来说是合作,就合作
欺软怕硬
根据对方的表现选择合作还是背叛
镇定者策略
先建立信任,再占小便宜
精神病患者
随机选择
用曹操策略对付
四点忠告
不要嫉妒
不要首先背叛
对合作和背叛都要给予回报(尽可能快)
不要耍小聪明
两点启示
合作的基础不是信任,而是关系的持续性
组织相对于个人而言往往具有更高的预期寿命,提高了关系的持续性
冷酷策略
选合作还是背叛
合作=3+3+3……+3+3……
背叛=5
考虑贴现因子
合作=3/(1-δ)
合作还是背叛取决于贴现因子的大小
贴现因子也是考虑下次博弈的可能性
旅游景点宰客的可能性很大,因为它认为没有下次的可能性
如何处理噪音
噪音
出现失误,做了错误的判断
选了合作却按了背叛
宽容
之前多次合作,这次背叛,可以宽容
悔悟
自己先背叛时,允许对方背叛自己一次而仍选择合作
宽容比悔悟表现的更好
噪音频率低时
悔悟比宽容表现更好
噪音频率高时
过多的宽容容易被人利用
知人者智,自知者明 胜人者力,自胜者强 小胜者术,大胜者德
主要内容
介绍博弈论的基础知识和分析方法
应用博弈论理解和分析社会现象
学习目标
对“博弈”有更深的理解
何为博弈
建立起基于“博弈”的新思维
如何博弈
推荐书目
用博弈的思维看世界
本课程教材
蒋文华
浙江大学出版社
2014年
博弈论与信息经济学
张维迎
上海三联书店
上海人民出版社
1996年
活学活用博弈论-如何用博弈论在竞争中取胜
戴姆斯·米勒
中国财政经济出版社
2006年
策略思维
中国人民大学出版生
2002年
阿维纳什·K·迪克西特
巴里·J·奈尔伯夫
妙趣横生博弈论
机械工业出版社
2009年
阿维纳什·K·迪克西特
巴里·J·奈尔伯夫
博弈与信息 博弈论概述第四版
博弈论经典
哈德罗·W·库恩
中国人民大学出版社
博弈论
朱·弗登伯格
让·梯若尔
难度较高