运筹说第130期 | 对策论引言

通过对对策论基础知识进行梳理和总结，小编绘制了《对策论思维导图》，如下图所示，对策论章节一共包含4个小节。

第1小节是对策论引言。介绍了对策论的基本概念，包含对策行为和对策论、对策现象的三要素、对策问题举例及对策的分类。

第2小节是矩阵对策的基本理论。介绍了矩阵对策的纯策略、矩阵对策的混合策略和矩阵对策的基本定理。

第3小节是矩阵对策的解法。分别介绍了图解法、方程组法和线性规划法3种矩阵对策的求解方法。

第4小节是其他类型对策简介。介绍了二人无限零和对策、多人非合作对策以及合作对策。

01 对策行为和对策论

1、对策行为

在日常生活中经常可以看到一些具有对抗或竞争性质的现象，如下棋、打牌、体育比赛等。在战争中的双方，都力图选取对自己最有利的策略，千方百计去战胜对手；在政治方面，国际间的谈判，各种政治力量间的较量，各国际集团间的角逐等都无不具有对抗性；在经济活动中，各国之间的贸易摩擦、企业之间的竞争等；举不胜举。

对策行为是具有竞争或对抗性质的行为。在这类现象中，参加竞争或对抗的各方各自具有不同的利益和目标。为了达到各自的利益和目标，各方必须考虑对手的各种可能的行动方案，并力图选取对自己最有利或最合理的方案。对策论（game theory）就是研究对策现象中各方是否存在最合理的行动方案，以及如何找到最合理的行动方案。

2、对策论

对策论又称竞赛论或博弈论，是研究具有对抗或竞争性质现象的数学理论和方法。它既是现代数学的一个新分支，也是运筹学的一个重要学科。对策论发展的历史并不长，但由于它所研究的现象和政治、经济、军事活动乃至一般的日常生活等有着密切联系，并且处理问题的方法具有明显特色，所以日益引起广泛的重视。特别是从20世纪50年代纳什（Nash）建立了非合作博弈的“纳什均衡”理论后，标志着对策论发展的一个新时期的开始。对策论在这一新时期发展的一个突出特点是，博弈的理论和方法被广泛应用于经济学的各个学科，成功地解释了具有不同利益的市场主体，在不完备信息条件下，如何实现竞争并达到均衡。正是由于纳什在对策论研究和将对策论应用于经济学研究方面的突出贡献，使得他1994年获得了诺贝尔经济学奖。他提出的著名的纳什均衡概念在非合作博弈理论中起着核心作用，为对策论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。

在我国古代，“齐王赛马”就是一个典型的对策论研究的例子。

战国时期，有一天齐王提出要与田忌赛马，双方约定：从各自的上、中、下三个等级的马中各选一匹参赛；每匹马均只能参赛一次；每一次比赛双方各出一匹马，负者要付给胜者千金。已经知道的是，在同等级的马中，田忌的马不如齐王的马，而如果田忌的马比齐王的马高一等级，则田忌的马可取胜。当时，田忌手下的一个谋士给他出了个主意：每次比赛时先让齐王牵出他要参赛的马，然后来用下马对齐王的上马，用中马对齐王的下马，用上马对齐王的中马。比赛结果，田忌二胜一负，夺得千金。由此看来，两个人各采取什么样的出马次序对胜负是至关重要的。

02 对策现象三要素

为对策问题进行数学上的分析，需要建立对策问题的数学模型，称为对策模型。根据所研究问题的不同性质，可以建立不同的对策模型。但不论对策模型在形式上有何不同，都必须包括以下3个基本要素。

1、局中人

一个对策中有权决定自己行动方案的对策参加者称为局中人，通常用I表示局中人的集合。如果有n个局中人，则I={1, 2, …, n}。一般要求一个对策中至少要有两个局中人。如在“齐王赛马”的例子中，局中人是齐王和田忌。

2、策略集

对策中，可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参加对策的每一局中人i，i∈I都有自己的策略集Si。一般，每一局中人的策略集中至少应包括两个策略。

在“齐王赛马”的例子中，如果用（上，中，下）表示以上马、中马、下马依次参赛，就是一个完整的行动方案，即为一个策略。可见，局中人齐王和田忌各自都有6个策略：（上，中，下）、（上，下，中）、（中，上，下）、（中，下，上）、（下，中，上）、（下，上，中）。

3、赢得函数 / 支付函数（payoff function）

一个对策中，每一局中人所出策略形成的策略组称为一个局势，即若si是第i个局中人的一个策略，则n个局中人的策略形成的策略组s=(s1, s2, …, sn)就是一个局势。若记S为全部局势的集合，则当一个局势s出现后，应该为每个局中人i规定一个赢得值（或所失值）Hi(s)。显然，Hi(s)是定义在S上的函数，称为局中人i的赢得函数。在“齐王赛马”中，局中人集合为I={1,2}，齐王和田忌的策略集可分别用S1={a1, a2, a3, a4, a5, a6}和S2={β1, β2, β3, β4, β5, β6}表示。这样，齐王的任一策略ai和田忌的任一策略βj就构成了一个局势sij。如果a1=（上，中，下），β1=（上，中，下），则在局势s11下齐王的赢得值为H1(s11)=3，田忌的赢得值为H2(s11)=-3，如此等等。

一般地，当局中人、策略集和赢得函数这3个要素确定后，一个对策模型也就给定了。

03 对策问题举例及对策的分类

1、囚徒困境

关于博弈论，流传最广的是一个叫做“囚徒困境”的故事。这个博弈是1950年塔克（Tucker）提出的。两个嫌疑犯作案后被警察抓住，分别关在不同的屋子里接受审讯。警察知道两人有罪，但缺乏足够的证据。根据法律，如果两个人都承认此案是他们干的，则每人各判刑7年；如果两人都不承认，则由于证据不足，两人各判刑1年；如果只有一人承认，则承认者予以宽大释放，而不承认者将判刑9年。因此，对两个囚犯来说，面临着一个在“承认”和“不承认”这两个策略间进行选择的难题。二者的得益矩阵如表1所示：

囚徒困境案例的前提假设如下：

①他们具备纯粹的博弈理性，即他们以自身利益最大化为目标，了解游戏规则，能清晰推导出自身选择的后果及对方选择的后果。

②不存在兄弟情谊，两人选择的损益仅限于刑期的长短。

③俩人的选择不会对他们未来的声誉造成影响。

在（坦白，坦白）这个组合中，囚徒1和囚徒2都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。

2、对策的分类

为了便于对不同的对策问题进行研究，对策论中将问题根据不同方式进行了分类。通常的分类方式有：

①根据局中人的个数，分为二人对策和多人对策；

②根据各局中人的赢得函数的代数和是否为零，分为零和对策与非零和对策；

③根据各局中人间是否允许合作，分为合作对策和非合作对策；

④根据局中人的策略集中的策略个数，分为有限对策和无限对策。

此外，还有许多其他的分类方式，例如根据策略的选择是否与时间有关，可分为静态对策和动态对策；根据对策模型的数学特征，可分为矩阵对策、连续对策、微分对策、阵地对策、凸对策、随机对策等，如下图所示。

在众多对策模型中，占有重要地位的是二人有限零和对策（finite two-person zero-sum game），又称为矩阵对策。这类对策是到目前为止在理论研究和求解方法方面都比较完善的一个对策分支。矩阵对策可以说是一类最简单的对策模型，其研究思想和方法十分具有代表性，体现了对策论的一般思想和方法，且矩阵对策的基本结果也是研究其他对策模型的基础。基于上述原因，本章将着重介绍矩阵对策的基本内容，只对其他对策模型作简要介绍。

以上就是对策论引言的全部内容了，通过本期学习，大家是否对对策论有了一个初步的认识呢？下一期小编将带大家学习矩阵对策的基本理论，敬请关注！