导图社区 约翰·冯·诺依曼的《博弈论》总结
这是一个关于约翰·冯·诺依曼的《博弈论》总结的思维导图,《博弈论》是冯·诺依曼的代表作,囊括了迄今为止除演化博弈之外的所有博弈论的理论和方法,代表了博弈论发展的高阶水平。该书既包含了博弈数学理论的细致说明,又包含了该理论多方面的应用与实践。书中用丰富详实的案例,介绍了零和博弈、三人博弈、混合策略、囚徒困境等经典的博弈理论。每个博弈案例背后,都有一个可以运用的策略帮助解决人生难题。
编辑于2024-12-30 22:24:49这是一个关于约翰·冯·诺依曼的《博弈论》总结的思维导图,《博弈论》是冯·诺依曼的代表作,囊括了迄今为止除演化博弈之外的所有博弈论的理论和方法,代表了博弈论发展的高阶水平。该书既包含了博弈数学理论的细致说明,又包含了该理论多方面的应用与实践。书中用丰富详实的案例,介绍了零和博弈、三人博弈、混合策略、囚徒困境等经典的博弈理论。每个博弈案例背后,都有一个可以运用的策略帮助解决人生难题。
这是一个关于《超级变现》总结的思维导图,该书是作者15年来的内容领域从业心得,详细介绍了图文、有声、视频、直播等知识内容的创作原理和方法,总结归纳了众多知识明星变现的路径,分享不同平台知识内容创作技巧,带领读者一览知识付费的多元变现模式。
这是一个关于《纳瓦尔宝典》精粹的思维导图,《纳瓦尔宝典》收集整理了硅谷知名天使投资人纳瓦尔的智慧箴言录,尤其是关于财富积累和幸福人生的原则与方法。纳瓦尔通过推特、博客和播客等方式分享了他的人生智慧,包括如何不靠运气取得成功、如何利用专长和杠杆获得财富以及他的幸福哲学等内容。
社区模板帮助中心,点此进入>>
这是一个关于约翰·冯·诺依曼的《博弈论》总结的思维导图,《博弈论》是冯·诺依曼的代表作,囊括了迄今为止除演化博弈之外的所有博弈论的理论和方法,代表了博弈论发展的高阶水平。该书既包含了博弈数学理论的细致说明,又包含了该理论多方面的应用与实践。书中用丰富详实的案例,介绍了零和博弈、三人博弈、混合策略、囚徒困境等经典的博弈理论。每个博弈案例背后,都有一个可以运用的策略帮助解决人生难题。
这是一个关于《超级变现》总结的思维导图,该书是作者15年来的内容领域从业心得,详细介绍了图文、有声、视频、直播等知识内容的创作原理和方法,总结归纳了众多知识明星变现的路径,分享不同平台知识内容创作技巧,带领读者一览知识付费的多元变现模式。
这是一个关于《纳瓦尔宝典》精粹的思维导图,《纳瓦尔宝典》收集整理了硅谷知名天使投资人纳瓦尔的智慧箴言录,尤其是关于财富积累和幸福人生的原则与方法。纳瓦尔通过推特、博客和播客等方式分享了他的人生智慧,包括如何不靠运气取得成功、如何利用专长和杠杆获得财富以及他的幸福哲学等内容。
约翰·冯·诺依曼的《博弈论》总结
前言+导读
一、博弈论
1、博弈的要素:决策人、对抗者、生物亲序(规律和有序)、局中人、策略、得失、次序(先后)、均衡(平衡)
2、纳什均衡:博弈中的所有人都将面临的一种特殊情况,即当对手不改变自己的策略时,他当前的策略是最优选择,如果参与者改变他当前的策略,他的利益就会受损
3、博弈均衡偶:策略集A中的策略a+和策略集B中的策略b+叫作均衡偶,对于策略集A和策略集B形成的成对策略a、b,总是满足以下条件:偶对(a,b+)≤偶对(a+,b+)≥偶对(a+,b)
4、非合作博弈对应的均衡概念
⑴.完全信息静态博弈:纳什均衡
⑵.完全信息动态博弈对:子博弈精炼纳什均衡
⑶.不完全信息静态博弈:贝叶斯纳什均衡
⑷.不完全信息动态博弈:精炼贝叶斯纳什均衡
二、意义
1、发展经济势必会造成环境污染
2、理性思想:抱最好的希望,做最坏的打算
三、策略
1、合作型博弈举例
⑴.A、B分别代表博弈双方
⑵.两人的选择:合作、不合作
⑶.用Y代表合作,用N代表不合作
⑷.规则和策略
若A和B都选择Y,两人都得3分,团体得分就是6分
若A和B都选择N,两人都得1分,团体得分是2分
若一人选Y,另一人选N,选Y的人得0分,选N的人得5分,团体得分是5分
2、一报还一报程序:每次对局都以对手上一次的策略作为参考
⑴.对手上一次选择合作,我这一次就选择合作
⑵.对手上一次选择不合作,我这一次就选择不合作
3、悔过的一报还一报:参与者对对方的背叛行为有一定概率不予以报复
4、修正的一报还一报:参与者有一定概率主动停止背叛别人
5、得分排名靠前的程序
⑴.善良性:从来不主动背叛别人
⑵.可激怒性:对于别人的背叛不能一直许以善意的合作,还要具备一定的报复
⑶.宽容性:别人背叛了你一次,你不能无休止地进行报复,而要在别人选择合作的时候与其合作
四、合作
1、群体中的合作是逐渐扩大化的,群体是向着越来越合作进化的
2、合作性的提高
⑴.建立在持久的关系上
⑵.提高识别别人行动的能力
⑶.说到做到,信誉第一
⑷.避免一次性对局,能多次完成的对局要尽量分步完成
⑸.对于别人的成功不要嫉妒,对于别人的失败不要落井下石
⑹.不要主动背叛别人
⑺.不仅要对合作予以回报,也要对背叛进行回报
⑻.不要贪小便宜
3、合作的基础:规则透明、诚实守信
五、竞争
1、垄断竞争市场:优胜劣汰原则,有新企业进入市场,也有旧企业退出
2、保障自身利益的策略
⑴.扩大生产能力
⑵.保证最低价格
⑶.掠夺性定价:把产品价格制定为成本价以下,让潜在竞争者认为无利可图,从而打消其进入市场的可能
⑷.广告战博弈
章节总结
第一章 策略博弈
1、博弈在古代的定义
⑴.博:赌博
⑵.弈:下棋、围棋
2、零和n+1人博弈:在一个有n+1个参与者的竞争环境中,各方的收益和损失相加总和仍然为零,即一方的收益必然意味着其他方的相应损失
3、着:在赛局的所有可能选择中做出抉择的权利,此项权利可以交给赛局中的某一个人执行,或者采用随机的方式进行,而这些方式在博弈的具体细则中都有非常明确的规定
⑴.机会的着:局中人的选择取决于机会
⑵.人的着:局中人的选择要参考他所掌握的情报信息
4、偷鸡:虚张声势
第二章 零和二人博弈
1、叫价:两个参与者需要下赌注,而这个赌注有大有小,完全取决于局中人自己的决策
2、看牌:这个局中人接受了第一个局中人的叫价
3、不看牌:局中人愿意接受他在前一局中最后一次的叫价
4、加叫:对方能够给出叫价者更多的叫价,以此还击叫价者给出的叫价
第三章 零和三人博弈
1、博弈
⑴.拥有:对手、竞争、对抗、输赢
⑵.活动:扑克、下棋、足球
2、零和三人博弈与零和二人博弈的本质区别:博弈的局中人是选择与其他的局中人达成合作还是打算单独行动
3、建立一套自认为普遍有效的理论,必须能够拥有承担所有的反对意见的能力
附录一 博弈论定律
一、零和博弈
1、一方输另一方赢:赢的一方得1分,输的一方扣1分,双方的得分是1+(-1)=0
2、无形掠夺,某地增减,别地减少,留给后人的减少少:机遇、财富、资源
二、重复博弈
1、次数:博弈可重复有限或无限次
2、贴现因子(δ):0到1之间,反映耐心程度,影响未来收益价值
3、策略:合作或背叛,选择取决于长期利益与短期收益的权衡
4、结果:长期利益下,合作可能成为稳定均衡
三、囚徒困境/非零和博弈
1、数字表示
⑴.人数:2人
⑵.选择:合作或背叛
⑶.结果
都合作:-1(每人)
都背叛:-8(每人)
一方合作,一方背叛:合作方-10,背叛方0
2、困境:担心对方背叛,最终可能都选择背叛,导致双方结果更糟
四、智猪博弈
1、数字表示
⑴.参与者:大猪、小猪
⑵.选择:踩踏板或不踩
⑶.成本与收益
⑷.踩踏板成本:2份食物能量
⑸.食物总量:10份
⑹.收益情况
大猪踩,小猪等:大猪4份,小猪4份
大猪等,小猪踩:大猪9份,小猪-1份
都踩:大猪5份,小猪1份
都不踩:0份
⑺.纳什均衡:大猪踩踏板,小猪等待,各自获益4份
2、弱势应该选择等待的占优策略
五、斗鸡博弈/懦夫博弈
1、数字表示
⑴.参与者:2人
⑵.策略:退缩(0)或进攻(1)
⑶.支付矩阵
若一方进攻,另一方退缩,则进攻方收益为2,退缩方收益为-1
若双方均进攻,则两败俱伤,收益均为-2
若双方均退缩,则收益均为0
2、一个人越不理性(即越愿意冒险进攻),就越有可能成为赢家,但这同时也意味着面临更大的风险
六、猎鹿博弈/安全博弈/协调博弈/猎鹿模型
1、数字表示
⑴.参与者:2人(猎人A和猎人B)
⑵.猎物选择:鹿或兔子
⑶.收益矩阵
若两人都猎兔,则各得4
若一人猎鹿另一人猎兔,则猎鹿者得0,猎兔者得4
若两人合作猎鹿,则平分猎物,各得10
2、合作与竞争之间的权衡
七、蜈蚣博弈
1、数字表示
⑴.参与者:A和B
⑵.策略选择:每人每轮有2种选择,即合作或不合作(背叛)
⑶.博弈轮数:通常为有限轮,如100轮
⑷.收益情况
一开始就有人选择不合作,两人收益都较低,如(1,1)
双方都选择一直合作,最后每人收益最高,如(100,100)
若一方在最后一步选择背叛,则该方收益会略高于一直合作的收益,而另一方则较低,如(98,101)
⑸.博弈结果:根据倒推法(逆向归纳法),理性参与者的首次选择均会是不合作,导致博弈在首轮就可能结束,双方收益为(1,1),远低于一直合作时的收益
2、逆向思维:采用逆向思维或倒推法可以帮助预测博弈的结果,但需注意其局限性
八、酒吧博弈
1、数字表示
⑴.参与者数量:通常为固定数值,例如100人
⑵.酒吧容量:设定值,如60人
⑶.两种选择:去酒吧(1)或不去(0)
⑷.结果:每周根据参与者的选择,实际去酒吧的人数会在0到100之间波动,通常围绕酒吧容量(如60人)上下浮动
2、非线性与不可预测性:由于信息不完全,预测准确去酒吧的人数非常困难,导致结果往往呈现混沌状态
九、枪手博弈
1、数字表示
⑴.参与者:3人
⑵.策略:每人选择向另一名参与者射击,目标是最大化自己的生存概率
⑶.命中率差异:通常设定不同参与者的命中率不同,例如A为80%,B为60%,C为40%
⑷.生存概率
命中率最高的A的生存概率为24%(在被B和C同时射击的情况下)
命中率次高的B的生存概率为20%(只被A射击)
命中率最低的C的生存概率为100%(在首轮无人射击他的情况下)
2、结果:在理性决策下,命中率最低的参与者C有最高的生存概率
十、警察与小偷博弈
1、数字表示
⑴.参与者:警察1人,小偷1人
⑵.地点与价值
酒馆:财产价值1万元
银行:财产价值2万元
⑶.策略
警察:以2/3的概率巡逻银行,1/3的概率巡逻酒馆(抽签决定)
小偷:以1/3的概率去银行,2/3的概率去酒馆(抽签决定,且与警察选择相反)
⑷.成功概率与期望收益
警察与小偷有同样的成功概率
警察保护财产的期望值:7/3万元(高于只巡逻银行的2万元)
2、核心定理:最小最大定理,即二人零和博弈中,双方的最大收益的最小值等于最小收益的最大值,形成均衡
十一、海盗分金
1、数字表示
⑴.海盗数量:5名
⑵.分配规则
由等级最高的海盗(1号)提出分配方案
接着,所有海盗(包括提出者)进行投票,超过半数同意则方案通过,否则提出者被扔下船,由下一位等级的海盗继续提出方案
投票过程依次进行,直到有方案通过或所有人都被扔下船
⑶.收益情况
假设有100枚金币
若1号海盗提出的方案被否决,则他会被扔下船,4号海盗成为新的最高等级海盗,面临重新分配的局面将是98枚金币(因为之前的2号和3号海盗已被扔下船)。
为了确保自己能得到尽可能多的金币,每个海盗都会基于自己的位置和后续可能面临的分配情况,来计算并投票支持能给自己带来最大利益的方案。
⑷.最优方案
1号海盗提出的最终分配方案为:98,0,1,0,1
即1号海盗得到98枚金币,3号海盗和5号海盗各得1枚金币,2号和4号海盗不得金币
这个方案能够得到通过,因为3号海盗和5号海盗知道,如果他们投票反对,接下来面临的分配情况会更糟(他们可能一枚金币都得不到)
2、合作与背叛:合作带来利益,但需防范背叛