运筹说 第130期 | 对策论引言

server/2024/12/18 15:56:17/

通过对对策论基础知识进行梳理和总结,小编绘制了《对策论思维导图》,如下图所示,对策论章节一共包含4个小节。

第1小节是对策论引言。介绍了对策论的基本概念,包含对策行为和对策论、对策现象的三要素、对策问题举例及对策的分类。

第2小节是矩阵对策的基本理论。介绍了矩阵对策的纯策略、矩阵对策的混合策略和矩阵对策的基本定理。

第3小节是矩阵对策的解法。分别介绍了图解法、方程组法和线性规划法3种矩阵对策的求解方法。

第4小节是其他类型对策简介。介绍了二人无限零和对策、多人非合作对策以及合作对策。

图片

01 对策行为和对策论

1、对策行为

在日常生活中经常可以看到一些具有对抗或竞争性质的现象,如下棋、打牌、体育比赛等。在战争中的双方,都力图选取对自己最有利的策略,千方百计去战胜对手;在政治方面,国际间的谈判,各种政治力量间的较量,各国际集团间的角逐等都无不具有对抗性;在经济活动中,各国之间的贸易摩擦、企业之间的竞争等;举不胜举。

对策行为是具有竞争或对抗性质的行为。在这类现象中,参加竞争或对抗的各方各自具有不同的利益和目标。为了达到各自的利益和目标,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最有利或最合理的方案。对策论(game theory)就是研究对策现象中各方是否存在最合理的行动方案,以及如何找到最合理的行动方案

2、对策论

对策论又称竞赛论或博弈论,是研究具有对抗或竞争性质现象的数学理论和方法。它既是现代数学的一个新分支,也是运筹学的一个重要学科。对策论发展的历史并不长,但由于它所研究的现象和政治、经济、军事活动乃至一般的日常生活等有着密切联系,并且处理问题的方法具有明显特色,所以日益引起广泛的重视。特别是从20世纪50年代纳什(Nash)建立了非合作博弈的“纳什均衡”理论后,标志着对策论发展的一个新时期的开始。对策论在这一新时期发展的一个突出特点是,博弈的理论和方法被广泛应用于经济学的各个学科,成功地解释了具有不同利益的市场主体,在不完备信息条件下,如何实现竞争并达到均衡。正是由于纳什在对策论研究和将对策论应用于经济学研究方面的突出贡献,使得他1994年获得了诺贝尔经济学奖。他提出的著名的纳什均衡概念在非合作博弈理论中起着核心作用,为对策论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。

在我国古代,“齐王赛马”就是一个典型的对策论研究的例子。

战国时期,有一天齐王提出要与田忌赛马,双方约定:从各自的上、中、下三个等级的马中各选一匹参赛;每匹马均只能参赛一次;每一次比赛双方各出一匹马,负者要付给胜者千金。已经知道的是,在同等级的马中,田忌的马不如齐王的马,而如果田忌的马比齐王的马高一等级,则田忌的马可取胜。当时,田忌手下的一个谋士给他出了个主意:每次比赛时先让齐王牵出他要参赛的马,然后来用下马对齐王的上马,用中马对齐王的下马,用上马对齐王的中马。比赛结果,田忌二胜一负,夺得千金。由此看来,两个人各采取什么样的出马次序对胜负是至关重要的。

 02 对策现象三要素

为对策问题进行数学上的分析,需要建立对策问题的数学模型,称为对策模型。根据所研究问题的不同性质,可以建立不同的对策模型。但不论对策模型在形式上有何不同,都必须包括以下3个基本要素

1、局中人

一个对策中有权决定自己行动方案的对策参加者称为局中人,通常用I表示局中人的集合。如果有n个局中人,则I={1, 2, …, n}。一般要求一个对策中至少要有两个局中人。如在“齐王赛马”的例子中,局中人是齐王和田忌。

2、策略集

对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参加对策的每一局中人ii∈I都有自己的策略集Si。一般,每一局中人的策略集中至少应包括两个策略。

在“齐王赛马”的例子中,如果用(上,中,下)表示以上马、中马、下马依次参赛,就是一个完整的行动方案,即为一个策略。可见,局中人齐王和田忌各自都有6个策略:(上,中,下)、(上,下,中)、(中,上,下)、(中,下,上)、(下,中,上)、(下,上,中)。

3、赢得函数 / 支付函数(payoff function)

一个对策中,每一局中人所出策略形成的策略组称为一个局势,即若si是第i个局中人的一个策略,则n个局中人的策略形成的策略组s=(s1, s2, …, sn)就是一个局势。若记S为全部局势的集合,则当一个局势s出现后,应该为每个局中人i规定一个赢得值(或所失值)Hi(s)。显然,Hi(s)是定义在S上的函数,称为局中人i的赢得函数。在“齐王赛马”中,局中人集合为I={1,2},齐王和田忌的策略集可分别用S1={a1, a2, a3, a4, a5, a6}和S2={β1, β2, β3, β4β5β6}表示。这样,齐王的任一策略ai和田忌的任一策略βj就构成了一个局势sij。如果a1=(上,中,下),β1=(上,中,下),则在局势s11下齐王的赢得值为H1(s11)=3,田忌的赢得值为H2(s11)=-3,如此等等。

一般地,当局中人、策略集和赢得函数这3个要素确定后,一个对策模型也就给定了。

03 对策问题举例及对策的分类

1、囚徒困境

关于博弈论,流传最广的是一个叫做“囚徒困境”的故事。这个博弈是1950年塔克(Tucker)提出的。两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。根据法律,如果两个人都承认此案是他们干的,则每人各判刑7年;如果两人都不承认,则由于证据不足,两人各判刑1年;如果只有一人承认,则承认者予以宽大释放,而不承认者将判刑9年。因此,对两个囚犯来说,面临着一个在“承认”和“不承认”这两个策略间进行选择的难题。二者的得益矩阵如表1所示:

囚徒困境案例的前提假设如下:

①他们具备纯粹的博弈理性,即他们以自身利益最大化为目标,了解游戏规则,能清晰推导出自身选择的后果及对方选择的后果。

②不存在兄弟情谊,两人选择的损益仅限于刑期的长短。

③俩人的选择不会对他们未来的声誉造成影响。

图片

在(坦白,坦白)这个组合中,囚徒1和囚徒2都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

2、对策的分类

为了便于对不同的对策问题进行研究,对策论中将问题根据不同方式进行了分类。通常的分类方式有:

①根据局中人的个数,分为二人对策和多人对策;

②根据各局中人的赢得函数的代数和是否为零,分为零和对策与非零和对策;

③根据各局中人间是否允许合作,分为合作对策和非合作对策;

④根据局中人的策略集中的策略个数,分为有限对策和无限对策。

此外,还有许多其他的分类方式,例如根据策略的选择是否与时间有关,可分为静态对策和动态对策;根据对策模型的数学特征,可分为矩阵对策、连续对策、微分对策、阵地对策、凸对策、随机对策等,如下图所示。

图片

在众多对策模型中,占有重要地位的是二人有限零和对策(finite two-person zero-sum game),又称为矩阵对策。这类对策是到目前为止在理论研究和求解方法方面都比较完善的一个对策分支。矩阵对策可以说是一类最简单的对策模型,其研究思想和方法十分具有代表性,体现了对策论的一般思想和方法,且矩阵对策的基本结果也是研究其他对策模型的基础。基于上述原因,本章将着重介绍矩阵对策的基本内容,只对其他对策模型作简要介绍。

以上就是对策论引言的全部内容了,通过本期学习,大家是否对对策论有了一个初步的认识呢?下一期小编将带大家学习矩阵对策的基本理论,敬请关注!


http://www.ppmy.cn/server/151211.html

相关文章

使用 XAML 和 C# 旋转 3D 立方体

此示例演示如何使用 XAML 显示和旋转 3D 立方体。它显示一个带有滚动条的蓝色三维立方体,您可以使用滚动条旋转立方体以从不同方向查看它。 下面显示了该程序的完整 XAML 代码。XAML 代码处理所有用户交互,包括旋转立方体,因此该示例不需要任…

winlogon!InitializeGlobals函数中的g_IsTerminalServer

winlogon!InitializeGlobals函数中的g_IsTerminalServer BOOL InitializeGlobals(HINSTANCE hInstance) { SID_IDENTIFIER_AUTHORITY SystemSidAuthority SECURITY_NT_AUTHORITY; ULONG SidLength; TCHAR szComputerName[MAX_COMPUTERNAME_LENGTH1]; DWORD dw…

[论文阅读]What Was Your Prompt? A Remote Keylogging Attack on AI Assistants

What Was Your Prompt? A Remote Keylogging Attack on AI Assistants http://arxiv.org/abs/2403.09751 研究背景和问题: (1) 实际应用场景和问题提出 大型语言模型 (LLM) 和基于聊天的 AI 服务(如 C…

一个免费好用的魔法

前不久发表了一个可以永久免费魔法才发表十几天就有1W人浏览,下载的人也有几百,但是老是被审核员针对被封了几天号,现在是发不出来的了 若是想要免费永久加速器的加联系方式,(需要支付俩块来支持一下,感谢支…

游戏关卡分析:荒野大镖客2雪山终战

1、相关剧情 主角约翰一家在农场过着悠闲的日子,突然平静被打破, 女枪手来报信,在某小镇找到了迈卡的消息。 于是激发了约翰的满腔怒气,不顾妻子的反对,坚决要出战, 要彻底歼灭迈卡,为亚瑟…

java服务器中,如何判定是该使用单例系统,还是微服务架构,多库分布式,服务分布式,前端分布式

在设计Java服务器架构时,选择单例系统、微服务架构、多库分布式、服务分布式还是前端分布式,需要根据具体的业务需求、技术栈、团队规模和项目复杂度等因素进行综合考虑。以下是各个架构模式的适用场景和优缺点分析,帮助你做出决策。 1. 单例…

学习Ajax (概述,应用场景,使用jQury 实现ajax)

目录 前言 概述 什么是Ajax? 同步交互与异步交互的区别是什么呢? 应用场景 场景1 在搜索框搜索 资源 场景2 登录业务的对用户名处理 AJAX的优缺点 优点: 缺点: 使用jQury 实现ajax 使用步骤 1 引入jQury 文件 2 使用Ajax 函数…

【蓝桥杯】43699-四平方和

四平方和 题目描述 四平方和定理,又称为拉格朗日定理: 每个正整数都可以表示为至多 4 个正整数的平方和。如果把 0 包括进去,就正好可以表示为 4 个数的平方和。 比如: 502021222 712121222; 对于一个给定的正整数,可…