导图社区 博弈论
博弈论知识体系框架图,涉及博弈论基本原理,静态博弈,动态博弈,博弈论是一种强大的分析工具,它能够帮助我们理解和预测各种竞争和合作现象,为决策制定提供重要的参考。
编辑于2024-04-15 11:06:52博弈论
主要结构
博弈方
单人博弈
研究最优化问题
信息拥有量与得益呈正相关
工具:得益矩阵、扩展形
两人博弈
掌握信息更多也并不一定获利最大
个人最求利益最大,常常会使得总体利益无法实现最大,并且导致个人利益也无法最大化
并不总是互相对抗,也存在利益一致的情况
多人博弈
破坏者:其策略选择自身的利益无影响,但严重影响其他博弈者的利益
博弈策略
并非所有博弈方具有相同的可选策略,数量也不一定相同
有限博弈:一个博弈中每一方的策略数量都有限
无限博弈:至少存在某一方博弈的策略数量有无限多个
博弈中的得益
各个博弈方追求的根本目标,也是他们行为和判断的主要依据
零和博弈:所有得益方的总得益之和为0;博弈方利益始终对立,偏好通常不一致
两人零和博弈称为严格竞争博弈
田忌赛马
常和博弈:所有得益方的总收益为某非0常数;对立性体现在各方得益多少,总体可能达到和平共处
多人分配奖金
变和博弈
囚徒困境、关于产量决策的古诺模型
可从社会总得益角度来评判其效率,说明自由竞争的经济存在低效率问题,政府对市场的监管是必要的
博弈过程
静态博弈:所有博弈方同时选择博弈策略
动态博弈:各博弈方具有选择和行动的先后次序,可以看到其他博弈方的选择和行动,博弈方具有不对称性
根本特征:行为有先后顺序
动态博弈中在轮到行为时对博弈的进程完全了解的博弈方,称为具有完美信息的博弈方,如果动态博弈的所有博弈方都具有完美信息,则称为完美信息的动态博弈
重复博弈:同一个博弈反复进行(最少次数为两次),分为有限/无限重复博弈,构成重复博弈的一次性博弈称为:原博弈/阶段博弈
博弈信息结构
各博弈方都完全了解所有博弈方各种情况下得益的博弈称为:完全信息博弈 反之则为不完全信息博弈
博弈方的能力和理性
决策行为的根本目标
追求目标的能力
主要行为逻辑
经纪人假设、个体理性、集体理性、完全理性、有限理性
完全信息静态博弈
各博弈方同时决策,且所有博弈方对各方得益都了解,属于完美信息博弈
基本研究方法
上策均衡
某博弈方的某个策略收益始终高于其他策略(至少不低于其他策略),则为上策。一个博弈中,某个策略组合中的所有策略都是各个博弈方的上策,则这个策略组合相对稳定,称这样的策略组合为上策均衡
纳什均衡包括上策均衡
划线法
在每个博弈方对其他博弈方每个策略或者策略组合的最佳对策对应的得益下划线,最终的出相对稳定的策略组合 先不确定自己的策略,根据对方某一策略观察自己的收益来决定自己的策略
箭头法
基本思路:对每一个策略组合进行分析,考察在每个策略组合处各个博弈方能否通过单独改变自己的策略从而增加收益,若可以,则从原策略引出一个箭头至改变后的策略组合
寻找纳什均衡常用方法
严格下策反复消去法
在一个博弈中,不管其他博弈方策略如何变化,一个博弈方的某个策略得益总是比其他某种策略低,则称前者相对于后者为一个严格下策
过程中不会消去纳什均衡的策略组合,最终剩下的一定是纳什均衡的策略组合
反应函数法
得益是策略的多元连续函数(每个博弈方针对其他博弈方策略的最佳反应构成的函数),反应函数的交点处达到纳什均衡
混合策略
以一定的概率分布在可选策略中进行随机决策
严格竞争博弈
各博弈方的利益和偏好始终不一致,在通常策略下没有纳什均衡
设定自己的各项选择的概率,使对方的收益在自己各项选择概率下所获得的收益相同
纳什均衡
在一个博弈中,如果由各个博弈方的各一个策略组成的策略组合中,任意博弈方的策略都是对其他策略组合的最佳对策,即达到该博弈的一个纳什均衡
混合策略纳什均衡
如果一个策略组合满足各博弈方的策略相互是其他博弈方策略的最佳对策,此处策略包括纯策略的混合策略,此时仍和博弈方单独改变的册策略或者随机选择各个纯策略的概率分布,都不能增加收益。
双方都无法单独改变自己的随机选择来改善自己的收益
一致预测性
如果所有博弈方都预测某一个特定的博弈组合会出现,那么所有的博弈方都不会利用该预测去选择与预测结果不一致的策略,故这个预测结果最终会成为真的博弈结果
本质属性、价值所在
纳什均衡的存在性
是纳什均衡概念最重要的性质
纳什定理
每个有限策略的博弈至少有一个混合策略的纳什均衡
缺陷:存在但不唯一、且不同纳什均衡至今无优劣关系
纳什均衡的选择
帕累托上策均衡
某个纳什均衡带来的收益明显高于其他纳什均衡
风险上策均衡
出于风险考虑和信任因素(某一方不配合则很难达成帕累托均衡),而选择收益较低的纳什均衡,放弃看似收益更高的帕累托均衡。
存在反馈机制:部分决策者选择风险均衡时,会使帕累托均衡实现难度增大,决策者存在收益变小的可能性增大,从而使更多决策者选择风险上策均衡保证一定的收益
聚点均衡
利用博弈规则之外的信息(习惯、文化背景)来进行决策,是较容易被选择的均衡
相关均衡
设置一定机制,排除收益最低的策略组合,保证收益最高策略出现的稳定性
防共谋均衡
(1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略 无利可图; (2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果; (3)依此类推,直到所有博弈方都参加的串通也丌会改变博弈的结果。 满足上述要求的均衡策略组合称为“防共谋均衡”
完全且完美信息动态博弈
基本概念
阶段:动态博弈中一个博弈方的一次行为选择
策略:在整个博弈中轮到选择的每个阶段,针对前面阶段的各种情况作相应选择的完整计划,是一个完整的行动计划
每组得益对应是每条路径,而不是对应每步选择、行为
分析方法
逆推归纳法
从动态博弈的最后一个阶段开始分析,确定所分析阶段博弈方的选择和路径,然后再确定前一个阶段博弈方的选择和路径。
存在的问题
设定必须非常明确:要求博弈的结构,包括次序、规则和得益情况等都非常清楚,并且各个博弈方了解博弈结构,相互知道对方了解博弈结构
不能分析复杂动态博弈结构,在遇到两条路径利益相同的情况时逆推归纳法会发生选择困难
要求所有博弈方都有高度的理性,不允许犯任何错误,而且要求所有博弈方相互了解和信任对方的理性,有“理性的共同知识”
子博弈
子博弈可以看作是动态博弈中满足一定要求的次级博弈,由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的组成部分,称为原动态博弈的一个“子博弈”
动态博弈本身不是它自己的子博弈。
子博弈不能分割任何信息集
子博弈完美纳什均衡
如果一个完美信息的动态博弈的一个策略组合满足在整 个动态博弈及它的所有子博弈中都构成纳什均衡,那么称该 策略组合为该动态博弈的一个“子博弈完美纳什均衡”
动态博弈分析的核心内容
经典模型
寡占的斯塔克博格模型
根据决策顺序分别求反应函数得各自收益
信息不对称博弈之下,信息较多的一方不一定有更多的收益
劳资博弈
讨价还价博弈
委托代理理论
无不确定性的委托人-代理人模型
激励相容约束
有不确定性的但可监督委托人-代理人模型
有不确定性的且不可监督委托人-代理人模型
选择报酬和想、连续努力水平的委托人-代理人模型
有同时选择的动态博弈模型
银行间接融资和挤兑风险
国际竞争和最优关税
关税有利于保护本国企业,但是不利于提高企业总产量
工资奖金制度
重复博弈
基本概念
重复博弈定义
给定一个基本博弈G(静态博弈或动态博弈),重复进行 T次G,并且在每次重复G时博弈方都能观察到之前博弈的 结果,这样的博弈过程称为“G的T次重复博弈”,记为 G(T)。而G则称为G(T)的“原博弈”。G(T)中的每次重复 称为G(T)的一个“阶段”。
策略
博弈方在每个阶段针对每种情况如何行为的完整计划
路径
由每个阶段博弈方的行为组合串联而成。 路径个数:m种策略组合,重复T次,有mT条路径。
贴现系数

平均得益:将某一常数作为重复博弈每个阶段的固定收益,其现在值之和与得益序列π1、π2、π3等相同的的现在值之和,则称该常数为平均得益

有限次重复博弈
无纯策略纳什均衡博弈,无法达成合作

唯一纯策略纳什均衡博弈(非帕累托最佳),无法达成合作 原博弈本身有帕累托最佳的纳什均衡,则没有博弈方愿意偏离,无讨论意义

连锁店悖论:不同决策方法可能引发矛盾
多个纯策略纳什均衡博弈
触发策略:博弈方先试探合作,一旦发现对方选择不合作则采取报复策略
将第二阶段可能得不同收益加到原博弈中可以得到一次性博弈的等价模型
轮换策略:博弈方轮流采用原博弈的纯策略纳什均衡
eg:三价博弈、两市场博弈
民间定理
Wi记为博弈方i在一次性博弈中的均衡得益,W记为各博弈方Wi构成的得益数组 个体理性得益:不管其他博弈方采取何种策略,一博弈方在某个博弈中只要采取某种特定策略最低限度能保证获得的收益 可实现收益:博弈中所有纯策略组合得益的加权平均数组
有限次重复博弈民间定理: 设原博弈的一次性博弈有均衡得益数组优于ω,那么在该博弈的多次重复中,所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡来实现它们。其目的:对各博弈方至少可实现的得益,和最佳情况下可实现的得益等进行考虑,以确定能实现得益的分布范围。
无限次重复博弈
零和博弈中博弈方无法达成合作
有唯一纯策略的纳什均衡博弈,原博弈纳什均衡非帕累托最佳,有可能达成合作 原博弈本身有帕累托最佳的纳什均衡,则没有博弈方愿意偏离,无讨论意义
两寡头销价竞争通过触发策略可达成合作
可以求出对应的贴现率保证该触发策略有效

无限次重复古诺模型
触发策略
胡萝卜加大棒原则

有效工资率

完全但不完美信息动态博弈
基本概念
完美信息:博弈中后面阶段的博弈方了解前面阶段博弈进程的所有信息
完全信息:各博弈方都完全了解所有博弈方各种情况下的得益
完美贝叶斯均衡
在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”
给定各博弈方的“判断”,他们的策略必须是“序列理性”的,即追求利益最大化
在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方的均衡策略决定
在不处于均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定
均衡路径上的信息集:按照均衡策略进行,则该信息集一定会达到,
单一价格二手车模型
市场类型

完全失败:卖方完全不卖
部分成功:卖方都卖,买方都买
合并均衡:有完美信息的博弈方(卖方)对于质量不一样的商品采用同样策略,不给拥有不完美信息博弈方提供有用信息
完全成功:卖方只卖好的,不卖坏的,买方全买
分开均衡:有完美信息的博弈方对于商品质量不同采用不同策略,给拥有不完美信息博弈方提供充分有用信息
接近失败:卖方投入部分坏产品,买方以一定概率随机买
各种均衡:好车价值V、坏车价值W、买入价格P、伪装费用W

市场部分成功的合并均衡
差车出现概率小且伪装费用远小于买车价格

市场完全失败的合并均衡
差车价值小于买车价格,且买方根据以往经验的出卖方若卖则一定是差车
市场完全成功的分开均衡
伪装费用大于买车价格

市场接近失败
买车价格大于差车价值,买方全部买进时收益为负、伪装价格小于买入价格

双价二手车交易:高价买好车收益优于低价买差车,高价买差车收益最低
均衡模型

柠檬原理:以次充好代价为0,此时买方收益小于0,卖方则无法卖,市场瘫痪
逆向选择

有退款保证的双价二手车交易:高价买差车则赔偿V-W,当差车装好车高价卖出去时还不如低价卖合算时,卖家则会放弃以次充好,市场环境正常
不完全信息静态博弈
基本概念
不完全信息指至少一个博弈方不完全清楚其他某些博弈方的得益或者得益函数
暗标拍卖
不完全信息的古诺模型
海萨尼转换:转换为完全但不完美信息动态博弈