完全信息动态博弈 - 科普新疆_新疆本地化科普资源共享开放平台

完全信息动态博弈

（一）定义

完全信息动态博弈描述了参与者在决策过程中具有完全信息的情形。在这种博弈中，每个参与者都清楚地知道博弈的规则、其他参与者的策略以及可能的结果。动态博弈考虑到时间的因素，即参与者的决策是连续进行的，每个参与者的行动会影响到未来的结果。

在完全信息动态博弈中，博弈的过程可以被建模为一个博弈树，其中每个节点代表一个决策点，每个边代表一个参与者的行动选择，子节点表示游戏的终止，并给出了每个参与者的支付。这种博弈形式适用于许多现实世界的情况，例如价格竞争、战略合作、资源分配等。

（二）逆向归纳

逆向归纳法（Backward Induction）是完全信息动态博弈中常用的分析方法，特别是在博弈树模型中。这种方法从博弈的最后阶段开始，逐步向前推导出每个决策节点的最优策略和最终结果。

具体步骤如下：第一步，确定最终阶段（终局）。确定博弈的最后阶段，即博弈树的叶子节点，也是游戏结束时的状态。在这些节点上，确定每个参与者获得的支付。第二步，倒推分析。从最后一个阶段开始向前分析。对于每个参与者来说，从他们可能做出的最后一个决策节点开始，根据他们能够获得的最大收益或最小损失来选择最优策略。第三步，逐步向前。在每个决策节点，根据参与者对未来决策的最佳反应，向前推导。对于每个决策者来说，他们会考虑其他决策者的最优策略，并选择使自己获得最大利益的行动。第四步，确定均衡。通过逆向归纳法确定所有决策节点的最优策略，从而找到整个博弈的均衡解。这就是通过逆向归纳法找到的完美子博弈均衡（Perfect Subgame Perfect Equilibrium）。

逆向归纳法的关键在于，通过从后向前的推导，可以逐步确定每个决策节点的最优行动，最终确定整个博弈的最优解。这种方法非常适用于完全信息动态博弈，因为在这种情况下，每个参与者都清楚地了解到博弈的所有信息，可以做出理性的决策。

（三）经典案例——斯塔克博格博弈

斯塔克博格模型（Stackelberg model）是一种领导者-追随者结构的动态博弈。在这个模型中，有一个领导者首先做出决策，然后其他参与者根据领导者的决策做出反应。

领导者考虑追随者的最佳反应，选择使自己获得最大利益的行动。假设领导者的决策是生产数量。追随者知道领导者的决策后，会选择使自己获得最大利益的反应。通常追随者的反应是生产数量。推导过程可归纳为，第一步，确定博弈的最后阶段，即追随者做出反应的阶段。第二步，逆向归纳，从最后阶段开始，追随者做出反应，领导者根据追随者的反应选择最优决策。第三步，领导者根据追随者的反应选择能够最大化自己利益的决策。最后，追随者根据领导者的决策选择能够最大化自己利益的反应。确定斯塔克博格均衡，即领导者和追随者的策略组合，使得领导者和追随者都无法通过单方面改变策略来获得更好的结果。