纳什均衡与我们的生活
摘要: 纳什均衡是博弈论的一个重要术语,以约翰・纳什命名。纳什均衡就是在人有限非合作博弈中的所有参与人的最优策略组合。由于一个博弈的纳什均衡解可能只有一个,也可能有多个,于是关于纳什平衡点精炼的问题逐渐被提出,而每一种精炼都是为了剔除某种不合理或者脆弱的纳什平衡点,从而就产生了子博弈纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。
关键词: 博弈论纳什均衡生活
纳什均衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰・纳什命名。博弈论,又叫做游戏理论或对策论,是一门以数学为基础,研究对抗冲突中最优解问题的学科。虽然博弈论从本质上来讲是研究决策问题,但与传统的决策分析相比,博弈论更加关注的是博弈决策中博弈各方的互动行为。博弈论思想最早源于中国古代,成书于春秋时期的《孙子兵法》中的军事理论与治国策略就蕴含了丰富深刻的对策思想。博弈论真正成为数学的一个分支始于1944年,Von Neumann和Morgenstern合作的《博弈论与经济行为》一书的出版,第一次给博弈(game)以明确的数学描述;对博弈现象最早用数学方法来研究的则是数学家E.Zermelo,始于国际象棋,体现于其论文《集合论在象棋对策中的应用》(1912);其后法国数学家Borel讨论引入了“最优策略”,并证明了其普遍存在性,同时预测了一些结论;在1950年和1951年,纳什提出了非合作博弈的均衡解,并证明了均衡解的存在,自此博弈发展到了一个很重要的阶段;到了二十世纪八九十年代,博弈论逐渐走向成熟,其发展已进入前所未有的辉煌时期,博弈论重构经济学大厦的趋势正逐步变为现实,在经济学中的应用越来越广泛,并正以主流经济学的面貌出现。随着博弈论的不断成熟,它不仅仅在经济领域和数学领域被广泛研究,我们发现博弈的思想在日常生活中无处不在,博弈就像空气,时刻伴随在我们身边,例如有名的“囚徒困境”、“智猪博弈”、“性别大战”等,还有小孩子们玩的“石头剪刀布”、“掷硬币”,大人们玩的“斗地主”、麻将、象棋、乒乓球等都是博弈论的应用。如果将博弈论与生活结合起来,那么生活中每个人都如同棋手,其每一种行为如同在一张隐形的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出许多精彩纷呈、变化多端的棋局,而博弈论正是研究棋手们的策略与技巧,并将其系统化的一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中找到最合理的策略。
一
在博弈论中,纳什是完全信息静态博弈的代表人物,他在1950年和1951年发表的两篇论文中定义了非合作博弈及其均衡解,并给出了均衡解的证明,后来人们称它为纳什均衡,即是假设有个参与人博弈,给定其他人战略的情况下,每个人选择自己的最优策略(个人最优策略可依赖于也可能不依赖于其他人的策略),所有参与人选择的策略一起构成一个策略组合。纳什均衡指的就是所有参与人的最优策略组合。为了清楚地了解纳什均衡,我们就以“囚徒困境”为例。据说有一位富翁家中财物被盗,警方通过此侦破此案,发现有两个嫌疑人A和B,将他们抓获后从他们的住处搜出受害人家中丢失的财物。但是,他们都矢口否认,于是警方将两人分开审讯。为了击垮他们的心理防线,警方告诉他们,如果主动坦白,可以从轻处罚;如果顽抗到底,一旦同伙招供,就要受到严惩。当然,如果两人都坦白,就不存在“主动交代”,两人都要受到严惩,只不过比抵赖要处罚轻一些。在这种情形下,两个囚犯都可以作出自己的选择,或者招供,即与警察合作,从而背叛他的同伙;或者保持沉默,与警察对抗到底。这样,就会出现以下几种情况:
在这个例子里,纳什均衡就是(坦白,坦白),在给定B坦白的情况下,A的最优策略是坦白,同理,给定A坦白的情况下,B的最优策略也是坦白。实际上,这里的(坦白,坦白)不仅是纳什均衡,而且是一个占优策略均衡,就是说,不论对方如何选择,个人的最优选择都是坦白。比如说,若B抵赖,A坦白的话被放出来,抵赖的话被判1年,所以坦白比抵赖好;若B坦白,A坦白的话被判8年,抵赖的话被判10年,所以坦白还是比抵赖好,这样坦白既是A的占优策略,又是B的占优策略,结果是每个人都选择坦白,各判8年。“囚徒困境”反映了个人理性与集体理性的矛盾,虽然两个都抵赖各判刑1年显然比都坦白各判刑8年好,但是他不满足个人理性要求,即(抵赖,抵赖)不是纳什均衡。
“囚徒困境”的思想在我们的日常生活中有着广泛的应用,比如市场上的商家常常通过降价来争夺市场,假设商家A和商家B是某市场上的两个竞争对手,他们原来用同一种较高的价格销售相同的产品,若这两商家不满足他们原来的市场份额和利润,就都想通过降价来争夺更大的市场份额和利润。但值得注意的是,当自己的降价引起对手的报复时,这种目的就不一定达到。假设两商家在原来的高价策略下各可以获利200万元,若商家A单独降价可以获得250万元利润,此时商家B因为市场份额被商家A抢去利润将下降到80万元,此时商家B也采取了降价,则两商家都只能得到120万元利润,此时博弈可以由下表表示:
由此表容易看出,假设商家B采用高价策略,那么商家A采用高价的200万,采用低价得250万,由于250大于200,商家A应采用低价,假设商家B采用低价,那么商家A采用高价得益80万,采用低价得益120万,由于120大于80,因此商家A也采用低价,用同样的方法分析商家B,商家B也应选低价策略,因而这个博弈的最终结果就是两商家都采用低价,最终各得120万元利润,即(120,120)就是纳什均衡解。当然囚徒困境思想的应用不仅仅是这一个例子,它还应用在公共产品的供给、军备竞赛、股票市场等许多方面。
二
由于一个博弈的纳什均衡解不止一个,有些博弈可能有无数个纳什均衡解,于是泽尔腾在1965年通过对动态博弈的分析完善了纳什均衡的概念,定义了“子博弈精炼纳什均衡”,这个概念的中心意义是将纳什均衡中包含的不可置信的威胁战略剔除去,使均衡战略不再包含不可置信的威胁。他要求参与人的决策在任何时点上都是最优的,决策者要随机应变,而不是固守旧略。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也缩小了纳什均衡的个数。当然这里应该指出的是一个精炼均衡首先必须是一个纳什均衡,但纳什均衡不一定是精炼均衡,只有那些不包含不可置信威胁的纳什均衡才是精炼纳什均衡。例如:假如有一个富家千金爱上了一个穷小子,可是姑娘的母亲觉得并不门当户对,于是姑娘的母亲坚决不同意,并威胁说,若女儿与小伙子不断绝恋爱关系,她就与女儿断绝母女关系。若女儿相信母亲的话,女儿就会中断与小伙子的恋爱关系,因为恋人可以重新选择,而母亲则无法重新选择。问题是假设女儿坚持到底最终与小伙子结婚,母亲难道真的会去断绝母女关系吗?一般来说是不会的,因为断绝母女关系对母亲的损害会更大,这就是说,母亲的威胁是不可置信的。聪明的女儿当然会明白,一旦与男友生米煮成熟饭,母亲只好妥协。结果是女儿会勇敢地坚持恋爱并结婚,母亲最终承认那个她当初并不喜欢的女婿。这就是此博弈中唯一的精炼纳什均衡。
纳什均衡和子博弈完美纳什均衡所反映的博弈都包括了一个基本假设,即博弈的结构、博弈的规则、所有局中人的策略空间和支付函数都是共同知道的,满足这样一个假设的博弈称为“完全信息博弈”,但在现实生活中这一假设往往得不到满足。在非合作博弈中,局中人对博弈的结构和其他局中人的特征并没有准确的了解的情况叫“不完全信息博弈”。在1967年以前,博弈论专家对不完全信息博弈是束手无策的,直到1967年至1968年海萨尼提出了不完全信息静态博弈,并定义了贝叶斯纳什均衡,即在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择,给定别人的战略选择,每个参与人的最优策略依赖于自己的类型,由于每个参与人仅知道其他参与人的类型的概率分布而不知道其真实类型,他不可能准确地知道其他参与人实际上会选择什么策略,这样他决策的目标就是在给定自己的类型和别人的类型依从策略的情况下,最大化自己的期望效用。也就是说,贝叶斯纳什均衡就是给定自己的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化。这种类型的例子在生活中也是无处不在,例如:某交通局有一段柏油路要包出去,通过招投标来进行。假设招标的办法为一级密封投标,让每个投标者将自己的标价写下并装入信封,一同交给交通局,信封打开后交通局选择标价最低者为中标者,此时不同的投标者之间进行的就是一场博弈。假定每个投标者都不知道其他投标者的真实生产成本而仅仅知道其概率分布,那么他在选择自己的报价时就面临着一种交替:一方面报价越低,中标的可能性越大,但另一方面,给定中标的情况,报价越低,利润就越小。分析证明,每个投标人的标价都依赖于他的生产成本,但一般来说,生产成本会低于贝叶斯纳什均衡标价,二者之间的差异随总投标人数的增加而减少,也就是说,投标人越多,交通局越有利。
三
前面说了静态博弈,其实在生活中还有动态博弈。在一个动态博弈中,行动是分先后次序的,后行动者可以通过观察先行动者的行动获得有关后者偏好、战略空间等方面的信息,修正自己的判断。就像日常生活中通过观察某人的行为表现来了解其品德一样,显然,先行动者知道自己的行为有传递自己特征信息的作用,就会有意识地选择某种行动来掩饰自己的真实面目。当然,在均衡状态下,理性人是不会被蒙混的。1975年泽尔腾和克瑞普斯(1982年)等人相继给出了不完全信息动态博弈的精炼贝叶斯纳什均衡的定义,即是当事人根据所观察到的他人的行为来修正自己有关后者类型的主观概率,并由此选择自己的行动。在我们的生活中,这样的例子也很多,例如:“黔驴之技”的故事就是一个不完全信息动态博弈:一头毛驴被带到贵州时,老虎从没见过驴子见它威武高大,心想它的本领一定很大。老虎就很好奇,于是凭着这个判断,老虎就躲在树林里偷偷观察毛驴,这是它的最优选择。过了一会儿,老虎走出树林,逐渐靠近毛驴,就想获得这个庞然大物的真实本领的信息。突然毛驴大叫一声,老虎吓了一跳,急忙逃走,这也是老虎的最优选择,因为毛驴的叫声是老虎意料之外的。过了两天,老虎又来观看,发现毛驴除了会大声叫之外没什么本领,可是仍然不敢吃毛驴,因为它还是不完全了解毛驴的真实本领。后来,老虎逐渐靠近毛驴,并故意往毛驴身上挤,毛驴实在忍无可忍,就往老虎身上踢了一脚,这下老虎反倒高兴了,因为它知道了毛驴不过就这点真实本领,此时,老虎对毛驴就有了全面的了解,于是扑过去就把毛驴吃掉了。在这个故事里,老虎通过观察毛驴的行为逐渐修正了对毛驴的看法,直到看清它的真实本领,最后把它吃掉,就是一个精炼贝叶斯均衡,而老虎的每一步行动都是给定它的判断下最优的。事实上,毛驴的行为也是理性的,它知道自己技能有限,不到万不得已它不会用仅有的一技,否则它早就被老虎吃掉了。这种博弈的思想在生活中也很多,比如:强者欺负弱者,信号传递模型,等等。
以上这些例子是我们日常生活中经常碰到的,这些博弈的思想也不知不觉地被人们使用,虽然博弈的例子数不胜数,但有一个共同特点,即参与者都是在每一场博弈中寻求自己的最优解。其实,人生就是一个不断合作和竞争的过程,在这些合作与竞争中,每个人都想使自己的利益最大化,从而得到一个自己认为满意的结果。由此看来,学习博弈论的目的不在于解法而在于寻求巧妙的策略,学习博弈论不是为了享受分析博弈的过程,而在于赢得更好的结果。博弈的思想来自现实生活,它既可以高度抽象地用数学来表述,又可以用日常事例来说明,并运用到生活中去,没有高深的数学知识,我们同样可以学习博弈论并成为生活中的策略高手,就像孙膑没有学过高数,但是这并不影响他通过最优策略来帮助田忌赢得赛马。
查看全文
false