导图社区 有限理性和进化博弈思维导图
经济博弈论第四章有限理性和进化博弈,介绍了有限理性博弈及其分析框架、最优反应动态、复制动态和进化稳定性等。
编辑于2022-01-11 20:19:30第四章 有限理性和进化博弈
本章介绍
有限理性基础上的进化博弈分析。完全理性在现实中很难满足,当社会经济环境和决策问题较复杂时,人们必须存在很大的理性局限
进化博弈分析是有限理性博弈分析的基本框架
核心
最优反应动态
复制动态
基本方法、概念、经典模型
有限理性博弈及其分析框架
有限理性及其对博弈的影响
有限理性博弈方
不满足完全理性假设的博弈方
有限理性则意味着一般至少有部分博弈方不会采用完全理性博弈的均衡策略
有限理性意味着均衡是不断调整和改进而不是一次性选择的结果,即使达到了均衡,也有可能再一次偏移
有限博弈方会在博弈过程中学习博弈通过试错寻找较好的策略
有限理性博弈分析框架
有限理性博弈方构成的,一定规模的特定群体内成员的某种反复博弈
分析框架通常假设博弈方有一定的统计分析能力和对不同策略效果的事后判断能力,但没有事先的预见和预测能力
这种分析与人们在现实决策活动中的实际行为模式是比较接近的
分析框架中,博弈分析的核心不是博弈方的最优策略选择(这是大多数经济分析、决策分析则核心),而是有限理性博弈方组成的群体成员的策略调整过程、趋势和稳定性
此处稳定性是指,群体成员采用特定策略的比例不变,而非某个博弈方的策略不变
这种博弈分析可以检验博弈决策在有限理性博弈方的学习和动态调整过程中的稳定性
最优反应动态
有快速学习能力的小群体成员的反复博弈
协调博弈的有限博弈方快速学习模型——小群体的快速学习
概念解释
最优反应动态
最适合描述这种理性层次博弈方的策略调整的动态机制,就是所谓的“最优反应动态”
协调博弈
假设博弈方的博弈内容在得益矩阵表中是两人的对称静态博弈,我们称它为“协调博弈”
协调博弈实际上是与“囚徒困境”相似的,有共同性质的一类博弈
假设
博弈方不了解对方得益函数或缺乏博弈意识等原因,无法在正确预期对方行为的前提下找到均衡策略,初试决策具有盲目性,但博弈方了解自身得益函数 ,可以事后看到对手策略(组合),并采用最优策略
最优反应动态中,博弈方调整策略可以同时或先后进行,可能根据对方的策略变化再次调整
最优反应动态收敛到某个双方最优的策略组合
可以用该策略组合预测长期中博弈的结果
并不收敛到任何策略,而是不断循环反复或者越来越发散
长期中双方策略和博弈结果不稳定,预测比较困难
此类有限理性模型的关键问题
最优反应动态是否收敛和收敛的条件
影响模型收敛的因素
模型本身的设定和性质
博弈模型本身是否存在均衡、均衡是否唯一
博弈学习过程的初始出发点
因为初始出发点不同,收敛到的稳态均衡可能也不同
初始步调不一致甚至可能导致最终无法收敛到稳态
均衡是否为宜和收敛速度快慢
复杂博弈关系的最优反应动态
假设、框架分析
反应、策略调整规则推导
8种情况
结论
除了初次博弈时所有博弈方都采用B的一种情况外,从其余所有情况出发,经过或多或少时期的最优反应动态法则的调整,最终都会收敛到所有博弈方都采用A的稳定状态
这意味着所有博弈方采用A的机会大大高于采用B的机会
总共32种可能的初次博弈情况中,只有一种是稳定于所有博弈方采用B的状态,其余31种都会收敛到采用A的状态
这说明所有博弈方都采用A策略和所有博弈方都采用B策略都是有限理性博弈人进行上述协调博弈的稳定状态
“所有博弈方都采用A”同时具有两个性质
在博弈方的动态策略调整中可以达到
对少量偏离的扰动具有稳健性
同时具有这两种性质的稳定状态,在进化博弈论中被称为“进化稳定策略”
A是进化稳定策略,B不是进化稳定策略
如果在所有博弈方采用A的稳态出现少数偏离A的情况,最优反应动态最终会调整回都采用A的状态,因此,所有博弈方采用A的稳态具有稳健性
但是,如果从一开始就是所有博弈方都采用B的稳态,只要某个博弈方偏离B,那么最优反应动态调整会离该稳态越来越远,因为此稳态并不是稳健的
古诺调整过程——典型的最优反应动态
问题
两寡头始终假设双方产量不变
什么是古诺调整
如果寡头无法从一开始就找到古诺均衡产量,往往会根据对手的(上期)产量调整自己的产量,在满足一定条件下会逐步收敛到均衡产量,这种产量调整的过程被称为“古诺调整”
古诺模型
是静态的,双方同时进行博弈
也有动态的古诺博弈,此时就是分阶段,每一个阶段是静态的,多个阶段组合成一起,是动态的
古诺调整的过程
复制动态和进化稳定性:两人对称博弈
专门分析学习速度较慢的有限理性博弈方的动态策略调整及其稳定性
含义解释
一个大群体里面,学习速度较慢的随机配对成员的反复博弈
随机配对的博弈
暗指所有博弈方都是相似的,也意味着进行的博弈时博弈位置无差异的两人对称博弈
学习速度较慢的表现
向优势策略转变是一个渐进的过程,不是所有博弈方同时调整,调整策略速度可以用复制动态公式表示
渐进代表着随着时间的变化而变化,是一个连续的函数
签协议博弈的复制动态和进化稳定策略
博弈方策略类型比例动态变化是有限理性分析的核心,其关键是动态变化的速度
博弈方学习模型的速度取决于两个因素
模仿对象的数量大小(可用相应类型博弈方的比例表示)
关系到观察和模仿的难易程度
模仿对象的成功程度(可用模仿对象策略得益超过平均得益的幅度表示)
一般两人对称博弈复制动态和进化博弈
协调博弈的复制动态和进化稳定博弈
最优反应状态与复制动态的比较
相似之处
两者都是大部分情况下会趋向于所有博弈方都采用策略1的效率较低的均衡,趋向于所有博弈方都采用策略2的较高效率均衡的情况较少
主要差异
复制动态趋向于效率较高均衡的机会11/61,比最优反应动态趋向于较嘎效率均衡的机会1/32要更高一些
意义
因为复制动态模型是学习速度很慢、理性层次非常低的博弈方,而最优反应动态,模拟的则是相对来说学习速度较快、理性层次较高的博弈方,因袭上述差异又一次给我们提供了这样的证据
当人们总体的理性达到不完美要求是,理性程度稍高的博弈方并不一定能得到比理性稍差的博弈方更理想的结果
鹰鸽博弈的复制动态和进化稳定状态
对称
非对称
蛙鸣博弈
复制动态和进化稳定策略:两人非对称博弈
有限理性的博弈方可进行非对称博弈
大群体成员间随机配对反复博弈就不再是合适的分析框架,必须用两个(或多个)有差别的有限理性博弈方群体的成员,相互之间随机配对博弈的分析框架
市场阻入博弈的复制动态和进化稳定策略
非对称鹰鸽博弈
补充
截面数据最大的缺点
结果的不稳定
今年好,明年不好
所以大多的数据都用面板数据来,三年内的
运筹学十分重要
最优规划
通过一层层的迭代,将最优方法找出来
规模经济与经济规模
经济规模
企业的产量、固定资产
规模经济
最小的成本达到最好的生产状态、最好的产量
任何一个企业都有规模经济
区别
机理
事物运动的规律
特征是其表现形式
机制
要怎么做,实现机理的方法是什么,将规律的东西变成行为
一般的硕士论文,提出一个问题,告诉我怎么解决问题
模式
可以被模仿,有维度的划分