导图社区 数学建模——博弈论笔记
这里面包含完美信息下的序列博弈、扩展式博弈、策略式博弈、不完美信息下的序列博弈、策略式博弈求解等等。
包含后角边缘核、接受后根传入纤维、胶状质、后角固有核、接收大量后根传入纤维、后角固有核、接收大量后根传入纤维等。
包含一般躯体运动核、一般内脏运动核、特殊内脏运动核、一般内脏感觉核、特殊内脏感觉核、特殊躯体运动核等等。
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
博弈论
扩展式博弈
一种博弈问题的常用描述方式
例子
绑架博弈、伽利略与宗教法庭、与汽车经销商的讨价还价
完美信息
所有的信息集都只有一个节点
当参与者作出决定时,知道博弈的所有情况
不完美信息
至少有一个或多个信息集包含多个决策节点
参与者做决定时不知道自己处于哪一阶段状况
策略式博弈
三要素
参与者集
参与者的策略集
参与者的收益函数
博弈描述方式
策略式博弈求解
策略
严格劣势策略
无论其他参与者的策略是什么,若策略S'的收益严格低于策略S"的收益,则策略S'严格劣于策略S"
占优策略
一个策略严格优于其他策略,则称占优策略
弱劣策略
弱占优策略
若(1)无论其他参与者的策略是什么,S'策略的收益至少等于S"的收益;(2)对于其他参与者的一些策略,S'策略的收益大于S"策略的收益,则S'弱占优于S"策略
重复剔除严格劣势策略准则(IDSDS)
稳定博弈
两人或三人非连续博弈中的纳什均衡
纳什均衡
定义组成
1.参与者是理性的。
自己收益最大化
2.信念是正确的。
对其他参与者的行为作出准确预测
若每个参与者根据对其他参与者策略的信念,采用最大化自身收益的策略,则这样一个策略组合是纳什均衡。
最优反应法 (多重纳什均衡求解)
对于其他参与者的每个策略集合,一个参与者的最优反应是使她收益最大化的一个策略。
(b,x)和(a,y)都是纳什均衡
N人非连续博弈中的纳什均衡
对称博弈
所有参与者除了有相同的选择之外,且有相同的收益
能否产生对称均衡由收益函数是否具有倾向效应和挤出效应决定
星肚史尼奇、航空安全、实习申请博弈
非对称博弈
市场进入博弈、国内动乱
多重纳什均衡的解 (两个选择准则)
非劣纳什均衡
优先选择
参与者不选择弱劣的纳什均衡
收益占优纳什均衡/帕累托标准
收益占优:其他策略组合中不存在每个参与者有一个严格更高的策略
基于集体理性→最有利于每一个人
连续博弈中的纳什均衡
不用微积分求解纳什均衡
例子:相同产品的价格竞争、价格一致承诺化解价格竞争、竞选总统
使用微积分求解纳什均衡
例子:差别化产品的价格竞争(戴尔和惠普)、猛犸象捕杀、配额资助对慈善资助的影响力
随机版本的博弈
混合策略
+随机参与的概率
总存在纳什均衡
经典
1.参与者想要按对方没有预料的方式作出行动
让自己无法预测
例子:点球、警车巡逻与毒贩交易、战争防线
2.挤出效应的对称博弈论
旁观者效应(多少人提供帮助的概率)
极大极小策略
即用来使参与者达到最优状态的策略,即会设想到其他参与者会通过选择策略来使参与者的收益最小
对于任何纯冲突的两个参与者而言,极大极小策略即纳什均衡
例子:福尔摩斯与莫瑞特
演化博弈与生物学
演化稳定策略
使群体对任何一次小的冲击都能保持稳定状态
严格纳什均衡(多总体模型)
例子:鹰鸽博弈、屎壳郎、侧边斑点蜥蜴
复制者动态模型
静止点
吸引子
非固定居所机构的互动博弈
世代交替模型
对行为的反馈来自未来
例子:部落防御
人存于世模型 (多人合作模型)
对行为的反馈来自其他人 (交换信息)
例子:eBay交易平台
非固定居所参与者的重复互动博弈
重复博弈
堑壕战:有限次视野
堑壕战:无限次视野
冷酷策略
任何违背游戏规则的行为都会招致惩罚,即双方在未来阶段都会被击中
例子:针对重复囚徒困境的实验证据
动态规划
应用
名誉
例子:吸血蝙蝠和互利主义、国王的债权人、福特公司和日工资5美元的规定
廉价谈话博弈
一个零成本的行动称为消息。以消息为载体的博弈称为廉价谈话博弈。
例子:防御性医疗、股票购买建议
前博弈沟通
信号传递博弈
精炼贝叶斯纳什均衡
序贯理性
参与者会基于其他参与者行动的信念制定一个最佳行动
一致信念
接收者的后验信念与发送者最大化自身利益的行动一致
行动
分离均衡
观察到的行动可以判断发送者的类型
半分离均衡
对所属类型透露出一点信息
混同均衡
行动不透露实情
例子:次品与二手车市场、恋爱、边缘政策博弈
不完全信息博弈
转换为不完美信息博弈 ——自然赋予XX属于某种类型的概率
自然
类型
贝叶斯博弈
期望收益
贝叶斯纳什均衡
例子:拍卖博弈(参与者拥有私人信息)、委员会与评审团的投票 类型为连续体时的一级密封价格拍卖博弈(微积分)
不完美信息下的序列博弈
子博弈精炼纳什均衡
如果策略组合的每个子博弈的子策略组合都是一个纳什均衡,那么这个策略组合就是一个子博弈精炼纳什均衡
承诺
限制未来的行为
益处:来源于他人了解到你以某种方式限制自己的行为后作出的回应
完美信息下的序列博弈
思想:将既定的参与者的最佳行动扩展到所有偶然事件中(不仅仅是那些在均衡博弈中发生的事件)
对于完全信息博弈而言,在每一个决策节点处,源于这一策略的行动能使参与者的收益最大化,那么这个策略就是~。
逆向归纳法
步骤
1.为每一个最后的决策节点找到最佳行动
2.在每个这样的决策节点,用有相应收益的抉择点取代树状图的一部分,设想出一个最佳博弈
3.重复前两个步骤直到最初决策节点
古巴导弹危机、种族歧视与运动队……
等待博弈
抢先博弈
排队博弈例子
消耗战