导图社区 数学建模——博弈论笔记
这里面包含完美信息下的序列博弈、扩展式博弈、策略式博弈、不完美信息下的序列博弈、策略式博弈求解等等。
包含后角边缘核、接受后根传入纤维、胶状质、后角固有核、接收大量后根传入纤维、后角固有核、接收大量后根传入纤维等。
包含一般躯体运动核、一般内脏运动核、特殊内脏运动核、一般内脏感觉核、特殊内脏感觉核、特殊躯体运动核等等。
社区模板帮助中心,点此进入>>
《影响力》思维导图
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
博弈论
扩展式博弈
一种博弈问题的常用描述方式
例子
绑架博弈、伽利略与宗教法庭、与汽车经销商的讨价还价
完美信息
所有的信息集都只有一个节点
当参与者作出决定时,知道博弈的所有情况
不完美信息
至少有一个或多个信息集包含多个决策节点
参与者做决定时不知道自己处于哪一阶段状况
策略式博弈
三要素
参与者集
参与者的策略集
参与者的收益函数
博弈描述方式
策略式博弈求解
策略
严格劣势策略
无论其他参与者的策略是什么,若策略S'的收益严格低于策略S"的收益,则策略S'严格劣于策略S"
占优策略
一个策略严格优于其他策略,则称占优策略
弱劣策略
弱占优策略
若(1)无论其他参与者的策略是什么,S'策略的收益至少等于S"的收益;(2)对于其他参与者的一些策略,S'策略的收益大于S"策略的收益,则S'弱占优于S"策略
重复剔除严格劣势策略准则(IDSDS)
稳定博弈
两人或三人非连续博弈中的纳什均衡
纳什均衡
定义组成
1.参与者是理性的。
自己收益最大化
2.信念是正确的。
对其他参与者的行为作出准确预测
若每个参与者根据对其他参与者策略的信念,采用最大化自身收益的策略,则这样一个策略组合是纳什均衡。
最优反应法 (多重纳什均衡求解)
对于其他参与者的每个策略集合,一个参与者的最优反应是使她收益最大化的一个策略。
(b,x)和(a,y)都是纳什均衡
N人非连续博弈中的纳什均衡
对称博弈
所有参与者除了有相同的选择之外,且有相同的收益
能否产生对称均衡由收益函数是否具有倾向效应和挤出效应决定
星肚史尼奇、航空安全、实习申请博弈
非对称博弈
市场进入博弈、国内动乱
多重纳什均衡的解 (两个选择准则)
非劣纳什均衡
优先选择
参与者不选择弱劣的纳什均衡
收益占优纳什均衡/帕累托标准
收益占优:其他策略组合中不存在每个参与者有一个严格更高的策略
基于集体理性→最有利于每一个人
连续博弈中的纳什均衡
不用微积分求解纳什均衡
例子:相同产品的价格竞争、价格一致承诺化解价格竞争、竞选总统
使用微积分求解纳什均衡
例子:差别化产品的价格竞争(戴尔和惠普)、猛犸象捕杀、配额资助对慈善资助的影响力
随机版本的博弈
混合策略
+随机参与的概率
总存在纳什均衡
经典
1.参与者想要按对方没有预料的方式作出行动
让自己无法预测
例子:点球、警车巡逻与毒贩交易、战争防线
2.挤出效应的对称博弈论
旁观者效应(多少人提供帮助的概率)
极大极小策略
即用来使参与者达到最优状态的策略,即会设想到其他参与者会通过选择策略来使参与者的收益最小
对于任何纯冲突的两个参与者而言,极大极小策略即纳什均衡
例子:福尔摩斯与莫瑞特
演化博弈与生物学
演化稳定策略
使群体对任何一次小的冲击都能保持稳定状态
严格纳什均衡(多总体模型)
例子:鹰鸽博弈、屎壳郎、侧边斑点蜥蜴
复制者动态模型
静止点
吸引子
非固定居所机构的互动博弈
世代交替模型
对行为的反馈来自未来
例子:部落防御
人存于世模型 (多人合作模型)
对行为的反馈来自其他人 (交换信息)
例子:eBay交易平台
非固定居所参与者的重复互动博弈
重复博弈
堑壕战:有限次视野
堑壕战:无限次视野
冷酷策略
任何违背游戏规则的行为都会招致惩罚,即双方在未来阶段都会被击中
例子:针对重复囚徒困境的实验证据
动态规划
应用
名誉
例子:吸血蝙蝠和互利主义、国王的债权人、福特公司和日工资5美元的规定
廉价谈话博弈
一个零成本的行动称为消息。以消息为载体的博弈称为廉价谈话博弈。
例子:防御性医疗、股票购买建议
前博弈沟通
信号传递博弈
精炼贝叶斯纳什均衡
序贯理性
参与者会基于其他参与者行动的信念制定一个最佳行动
一致信念
接收者的后验信念与发送者最大化自身利益的行动一致
行动
分离均衡
观察到的行动可以判断发送者的类型
半分离均衡
对所属类型透露出一点信息
混同均衡
行动不透露实情
例子:次品与二手车市场、恋爱、边缘政策博弈
不完全信息博弈
转换为不完美信息博弈 ——自然赋予XX属于某种类型的概率
自然
类型
贝叶斯博弈
期望收益
贝叶斯纳什均衡
例子:拍卖博弈(参与者拥有私人信息)、委员会与评审团的投票 类型为连续体时的一级密封价格拍卖博弈(微积分)
不完美信息下的序列博弈
子博弈精炼纳什均衡
如果策略组合的每个子博弈的子策略组合都是一个纳什均衡,那么这个策略组合就是一个子博弈精炼纳什均衡
承诺
限制未来的行为
益处:来源于他人了解到你以某种方式限制自己的行为后作出的回应
完美信息下的序列博弈
思想:将既定的参与者的最佳行动扩展到所有偶然事件中(不仅仅是那些在均衡博弈中发生的事件)
对于完全信息博弈而言,在每一个决策节点处,源于这一策略的行动能使参与者的收益最大化,那么这个策略就是~。
逆向归纳法
步骤
1.为每一个最后的决策节点找到最佳行动
2.在每个这样的决策节点,用有相应收益的抉择点取代树状图的一部分,设想出一个最佳博弈
3.重复前两个步骤直到最初决策节点
古巴导弹危机、种族歧视与运动队……
等待博弈
抢先博弈
排队博弈例子
消耗战