登陆注册
19780200000027

第27章 均衡博弈:优势策略和劣势策略的终极

在均衡博弈中,一个优势策略优于任何其他策略;同样,一个劣势策略则劣于任何其他策略。如果你有一个优势策略,你可以选择采用;同样,假如你有一个劣势策略,你应该避免采用。

从爱情故事中解读优劣策略与均衡

美国著名批判现实主义作家欧·亨利在其小说《麦吉的礼物》中描述了这样一个爱情故事:

新婚不久的妻子和丈夫,很是穷困潦倒。除了妻子那一头美丽的金色长发,丈夫那一只祖传的金怀表,便再也没有什么东西可以让他们引以为傲了。虽然生活很累很苦,他们却彼此相爱至深。每个人关心对方都胜过关心自己。为了对方,他们愿意奉献和牺牲自己的一切。

明天就是圣诞节了,小两口都是身无余钱。为了让爱人过得好一点,两个人都想悄悄准备一份礼物给对方。丈夫卖掉了心爱的怀表,买了一套漂亮发卡,去配妻子那一头金色长发。妻子剪掉心爱的长发,拿去卖钱,为丈夫的怀表买了表链。

最后,到了交换礼物的时刻,他们无可奈何地发现,自己如此珍视的东西,对方已作为礼物的代价而出卖了。花了惨痛代价换回的东西,竟成了无用之物。出于无私爱心的利他主义行为,结果却使得双方的利益同时受损。

欧·亨利在小说中写道:“聪明的人,送礼自然也很聪明。大约都是用自己有余的物事,来交换送礼的好处。然而,我讲的这个平平淡淡的故事中的两个傻孩子,却是笨到极点,彼此为了对方,白白牺牲了他们屋檐下最珍贵的财富。”

从这段文字看,欧·亨利似乎并不认为这小两口是理性的。且让我们暂时抛开爱情的温馨,单从利益的角度来解读。

冯·诺伊曼认为:在一个二人零和游戏中,总会找到一种明确而合乎理性的方法以获得个人的最佳利益,而这个“明确而合乎理性的方法”就是“极小极大原理”。诺伊曼的这一发现可能是博弈论最重要的核心内容。

何谓“极小极大原理”呢?用通俗一点儿的话说就是,你想赢得竞争,可能有几种选择,你当然愿意选择受益最大的一种;但是你的选择不能不考虑到对方的决策,因为他跟你一样,也是这样想的,所以你必须把对方的选择也考虑清楚。比如上面这个爱情故事中,因为双方都以自己的付出视为最大的受益,所以面对付出和不付出这两种策略选择,他们都会选择付出,选择了付出,无论对方作出何种决策,其效果都比另一种——不付出,要好,此时的付出策略就被称为这场博弈中的“优势策略”。反之,不付出是这场博弈的“劣势策略”,也即在博弈中,不论对方采取什么策略,在我们可能采取的策略中,对自己严格不利的策略,劣势策略是我们在日常生活中不可以选择的行动。显然,如果双方都选择优势策略,那么这个博弈就是有迹可循、可以预测的,也就是所谓“理性的解”,并形成某种“定式”,即均衡。

实际上,上面的例子有一个优势策略均衡。通俗地说,在优势策略均衡中,不论所有其他参与人选择什么策略,一个参与人的优势策略都是他的最佳策略。显然,这一策略一定是所有其他参与人选择某一特定策略时该参与人的占优策略。

再举个常见的例子:一名篮球前锋和队友在篮下面对着对方的一个后卫时,形成了二打一的局面。该前锋可以选择直接投篮,也可以选择传球给队友,根据经验,传球过人的成功率更大,那么传球就是该前锋的优势策略。即某些时候它胜于其他策略,且任何时候都不会比其他策略差。

如果一个球员,无论其他球员怎么做,他的策略都会高出一筹,那么这个球员就有一个优势策略。当然如果一个球员有这么一个优势策略,他的决策就会变得非常简单,只需直接采用该策略而完全不必考虑对手的应对策略。

还有一个要注意的问题,即采用优势策略得到的最坏结果并不一定比采用另外一个策略得到的最佳结果要好,这是很多博弈论普及书中容易出错的一个问题。应该说,对局者所采用的优势策略在对方采取任何策略时,总能够显示出优势。

同时行动中的优势策略

博弈实际上就是互动的策略性行为,在每一个利益对抗中,人们都是在寻求满足自身利益最大化的优势策略。另外,博弈的精髓在于参与者的策略相互影响、相互依存。这种互动通过两种方式体现出来。

其中一种互动方式是同时行动。比如囚徒困境故事中的情节,参与者同时出招,完全不知道其他人走哪一步。不过,每个人必须心中有数,知道这个博弈游戏存在其他参与者,其他参与者也非常清楚这一点。因此,每个人必须设想一下若是自己处在其他人的位置,会作出什么反应,从而预计自己这一步会带来什么结果。他选择的最佳策略也是这一全盘考虑的一个组成部分,无论对方采取何种策略,均应采取自己的优势策略。这正是博弈论研究的主题,为了理解这一点,我们来看一个新闻大战的案例。

美国的两大杂志《时代》和《新闻周刊》在每个星期都会暗自较劲,对于作为周刊的《时代》来说,作出引人注目的封面故事是非常重要的。因为一个饶有趣味的封面,可以吸引站在报摊前的潜在买主的目光。所以说,《时代》的编辑们每个星期都会举行闭门会议,选择下一个封面故事。

其实,他们这么做的时候,《新闻周刊》的编辑们也在关起门来开会,选择下一个封面故事。换句话说,《新闻周刊》的编辑们知道《时代》的编辑们正在做与他们同样的事,而《时代》的编辑们也知道《新闻周刊》的编辑们知道这一点……这两家新闻杂志投入了一场策略博弈中。

由于《时代》与《新闻周刊》的行动是同时进行的,而双方也不得不在毫不知晓对手决定的情况下采取行动。如果等到彼此发现对方做什么时,再想做或改变什么就太迟了。当然,这个星期的输家很可能在下个星期竭力反扑,但是等到那时,或许已经出现了另外一种搏击模式,双方展开的又将是一场完全不同的博弈。

从《时代》和《新闻周刊》的新闻大战中我们可以看出,同时行动中的博弈策略与相继行动中的策略有很大不同。这种博弈相当于下棋时的一人一步的相继行动,每个参与者都必须向前展望,估计对手的意图,然后倒后推理,从而决定自己应该怎么走才会在这一轮中占据优势。这是一条线性的推理链:“假如我这么做,他就会那么做——若是他那样的话,我会这么反击”,依此类推。换句话说,你怎么走取决于对手的上一步行动。

那么,对于每个竞争者来说,应该怎样才能看穿所有那些错综复杂而又看不见的策略呢?

最重要的一点就是,你不要把其他参与者的未知行动看做像天气那样,具有与个人无关的不确定性。也就是说,对于两家周刊来说,为封面故事而做决定的概率与天气是否变坏的概率完全不同。区别在于,《时代》的编辑对《新闻周刊》有一个非常中肯的了解——另一个杂志的编辑与天气不同,他们是策略的博弈参与者,就跟《时代》的编辑自己一样。就算是同一个编辑也不会真的观察到另一个杂志的决定,但是他可以通过另一个杂志的视角思考这个问题,猜测对方现在在做什么。此时,寻找一个优势策略是首要任务。

我们假设本周有两个大新闻:一个是国会就预算问题吵得不可开交;另一个是发明了一种据说对艾滋病有特效的新药。当两家周刊的编辑们选择封面故事时,都会首先考虑的是哪一条新闻能更加吸引报摊前的买主(订户则无论采用哪一条新闻封面故事都会买这本杂志)。我们假设在报摊前的买中,有30%的人对预算问题感兴趣,70%的人对艾滋病新药感兴趣,每个人都只会掏钱买那本封面故事是自己感兴趣的新闻的杂志。如果两本杂志用了同一条新闻做封面,那么感兴趣的买主就会平分两部分,一部分买《时代》,而另一部分买《新闻周刊》。而如果一家用预算做封面故事,另一家用艾滋病新药做封面故事,那么买主就会是3:7。

这时,双方就开始积极行动,《时代》的编辑会进行如下推理:“如果《新闻周刊》采用艾滋病新药做封面故事,那么,我要是采用预算问题的话,我就会得到整个‘预算问题市场’(即全体读者的30%);但我要是采用艾滋病新药的话,我们两家就会平分‘艾滋病新药市场’(即我得到全体读者的35%),所以说,‘艾滋病新药’所带来的收入就会超过预算问题。如果《新闻周刊》采用预算问题,那么,我要是采用同样故事的话,我得到一半的读者,假设我采用艾滋病新药,就会得到70%的读者;这一次的方案会给我带来更大的收入。因此,不论对手采取什么策略我的优势策略,就是采用艾滋病新药做封面。”

由此可见,在那些不存在传统策略均衡的博弈中,仍然可以根据优势策略的逻辑找出均衡。只要有一方拥有优势策略,那么它将采用其优势策略,另一方则针对这个策略采用自己的最佳策略。

相继行动中的优势策略

在上一节中我们讨论了在同时行动中的优势策略这里我们再来讨论博弈的另一种互动形式——相继行动。每个参与者在轮到自己的时候,必须展望一下他的这一步行动将会给其他人以后的行动造成什么影响,对自己以后的行动造成什么影响。也就是说,相继行动的博弈中,每一个参与者必须预计其他参与者接下来会有什么反应,据此盘算自己的最佳招数。

我们先来看一个例子:

东晋时,桓玄执掌朝权后,任命卢循为永嘉太守。卢循表面受令,却暗中扩展势力。刘裕平定桓玄之乱后控扼东晋朝政,任命卢循为广州刺史,卢循的姐夫徐道覆为始兴相。

公元410年春,卢循和徐道覆趁刘裕北伐南燕,后方空虚之机,实施北征。他们率军在始兴会合,然后分东西二路北上,进入湘州(今长沙)与江州(今江西九江西南)诸郡,一路势如破竹,声威大震。徐道覆力主东进,卢循犹豫数日才勉强同意,遂自桑落洲(今江西九江东北)进抵淮口(今江苏南京西北秦淮河口),向兵力不过数千的建康逼近。

刘裕闻讯,急忙自北线前线返京,紧锣密鼓地部署防卫行动,来到长江边,刘裕对各位将领说:“贼兵如果从新亭直接挺进,那么他们的锋芒就不可阻挡,应该暂且回避一下,是胜是负也就不可推测了。如果他们回到西岸去停泊,就可以一战擒之了。”

徐道覆建议从新亭进军白石,然后烧掉战船登陆,分几路进攻刘裕。卢循打算采取尽可能保险的策略,对徐道覆说:“根据敌军的慌乱程度来看,他们自会在几天内崩溃散乱。现在,决定胜负也就是一个早上的事,一味凭侥幸在战场上投机取利,既不一定能战胜敌人,又会损兵折将,不如按兵不动。”

刘裕在城头遥望卢循的部队,最初看见他们向新亭方向移动,刘裕脸色稍变,恐怕卢循发动突然袭击。后来他看见敌军船只回到蔡州停泊下来,马上调动各路军队转移集中,砍伐树木在石头城和秦淮河口等地全部立起栅栏。同时命人尽快整修越城,兴筑查浦、药园、廷尉三座堡垒,派兵在那里把守。结果,卢循兵临建康近两月,兵疲粮乏,被迫于七月初退还浔阳,最后兵败投水自杀。

通过分析我们可以看出,在这场相继行动的战役中,卢循之所以失败,是因为他不应该受到对方状态的影响,一鼓作气,渡过长江,才是他的最优策略。作为进攻的一方,无论对方是已经调集了人马还是没有调来人马,他的策略都可以保证自己的锐气不被挫伤,并且制造最大的压力。

从上面这个例子中我们可以归纳为一个指导相继行动时的博弈的法则:假如你有一个优势策略,请照办,不要考虑你的对手会怎么做。假如你没有一个优势策略,但你的对手有,那么就假定他会采用这个优势策略,相应选择你自己最好的做法。

在已经确立了同时行动的优势策略的前提下,如果运用了相继行动的博弈,在采用优势策略的时候就必须留神。因为策略互动的本质已经改变,优势策略的概念就会完全不同。假如你有一个优势策略,无论你的对手选择怎么做,你按照这个策略做就行。如果你选择相继行动,而你的对手先行,你就应该选择自己的优势策略。这是你对你的对手每一个行动的最佳对策,也是对他选择的特定行动的最佳对策。但是,如果你先行,你就不会知道你的对手将会采取什么行动。而他会观察你的选择,同时作出自己的决定,所以说他的选择将会受到你的选择的影响。在一些情况下,如果采用优势策略以外的策略,你将会有更有效地施加这种影响。

当没有优势策略时

在博弈中,并不是所有的博弈者都有优势策略,哪怕这个博弈只有一个参与者。实际上,优势与其说是一种规律,不如说是一种例外。虽然出现一个优势策略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活中的博弈。此时我们必须运用其他原理来寻求解决之道。

我们知道一个优势策略优于任何其他策略,同样,一个劣势策略则劣于任何其他策略。如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会采用;同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略,他同样会避免采用。

假如你只有两个策略可以选择,其中一个是劣势策略,另一个一定是优势策略。那么,你的策略,必须建立在一方拥有至少三个策略的博弈的基础之上,采用与选择优势策略做法完全不同的规避劣势策略的做法。也即在你没有优势策略的情况下,你要做的就是剔除所有劣势策略,不予考虑,如此一步一步做下去。

假如在博弈过程中,在较小的博弈里出现了优势策略,应该一步一步挑选出来。如这个过程以一个独一无二的结果告终,那就意味着你找到了参与者的行动指南以及博弈的结果。即便这个过程不会以一个独一无二的结果告终,它也会缩小整个博弈的规模,并把博弈的复杂程度降低了。

对利用优势策略方法与规避劣势策略方法进行简化之后,整个博弈的复杂程度已经降到最低限度,不能继续简化,而我们也不得不面对循环推理的问题。你的最佳策略要以对手的最佳策略为基础,反过来从你的对手的角度分析也是一样。在博弈中,无论是具有优势策略还是劣势策略,都是为了达到均衡的结果,关键是看你如何行动了。

同类推荐
  • 硅谷禁书1

    硅谷禁书1

    《硅谷禁书》(THE MASTER KEYSYSTEM)是一本奇书,由作者在1912年创作出版,当时销售了20多万册,1933年起,它奇迹般的从市场上消失了,原因是很多成功的商人不愿意让更多的人看到此书,而担心更多人因此书而创富。这些商人联合起来,让美国教会查禁了这本书。这本书是硅谷最神奇的成功奇书,早年,这本书的手抄本甚至炒到3000多美金,几乎所有硅谷的亿万富翁都阅读过此书,世界首富比尔·盖茨在哈佛大学上学时,因为偶然的机会读到此书,立即决定弃学从商,从而创造了软件帝国的神话。美国成功学之父拿破仑?希尔因为得到本书的启示成为成功学大师。
  • 带着快乐去工作

    带着快乐去工作

    作为中国职业界健康系列读本之一,《带着快乐去工作》一书以“快乐产生激情,快乐营造健康和智慧,快乐营造迈向成就的职业活力”为主题,讲述了快乐工作、幸福生活的幸福生活观。全书结合古今中外的快乐工作或生活方式,针对现实中存在的郁闷、压力、缺乏原动力等问题,提出了快乐工作就是成功人生的哲理。
  • 明辨是非

    明辨是非

    “是非之心,智之端也。”明白是非、曲直、善恶、真假和知己识人的能力,即“智谋之力”。在纷繁复杂的事物中,我们应该拥有一颗通透的心,能洞悉美丑,看到世间的善恶,在成长的过程中我们应该逐渐具备辨明是非的能力,清楚的去认识身边的世界,使其变得清晰,变得明亮。本书精选的经典故事,意蕴深妙,语言简练,在拓展青少年朋友们阅读面的同时更有助于培养他们明辨是非的能力。
  • 超越自我(影响你一生的成功励志书)

    超越自我(影响你一生的成功励志书)

    心态决定一切! 智慧创造一切! 这是一个人人追求成功的时代, 心智的力量具有创造成功态势的无穷魔力! 即具有成功暗示的随着灵感牵引的成功力。
  • 讲述李静眼中的80后:做自己

    讲述李静眼中的80后:做自己

    书中,李静以励志散文的形式讲述了在10位明星人物的故事。他们中间有一夜成名的偶像、有粉丝千万的作家、有风格大胆的新锐主持人——李宇春、郭敬明、王珞丹、韩庚、文章、张杰…他们是清一色的80后,虽然年纪不大,却敢打敢闯,在他们各自的领域取得了非常好的成绩。作为金牌主播的李静以一个过来人的眼光记录了这10位明星丰富的成长历程和闪光的拼搏精神,其中对明星奋斗史的解读,更加入了自己的心灵感悟,是一本为正在成长期的8090后度身定做的感人励志书。
热门推荐
  • 青春无罪

    青春无罪

    一段年少时的爱恋,牵出一生的纠缠。大学时代的王志浩阳光灿烂,对法学系大才女杜梅一见倾心,开朗直率的他拔足倒追,终于使才气出众的她为他停留驻足。然而,不善表达的他终于使她在一次伤心之下远走他乡。十年后,杜梅回国,在大上海拥挤的人潮中,第一眼就看到他,他俊挺依旧,出众依然……本书从荷花镇里的月亮餐厅为线索,把一段刻骨铭心的爱情娓娓诉来。书中男主角王志浩深情而执着,平静的外表下汹涌着刻骨的相思,冷淡的语言中暗藏着最深的温柔。如果世界上曾经有她出现过,其他任何人对他来说,都成了将就........
  • 圣魔大陆

    圣魔大陆

    朱缇,单身,父母早亡,没有任何亲戚朋友,是明朝开国皇帝——朱元璋的第44代玄孙,虽然明朝早已经灭亡了,但是在我的爷爷的爷爷的爷爷的……在当朝的时候就非常的喜欢收集各种武功秘籍,更在其中整理出了最优秀的几种,让自己的子孙修炼,其中最厉害的就是道心种魔大法。
  • 晚安,我亲爱的孤独

    晚安,我亲爱的孤独

    午歌,“晚安故事开创者”,韩寒[ONE一个]常驻作者,以超高的故事质量,幽默逗比而又温暖深情的独特鲜明的个人风格,吸引了一大批忠实读者。这23个故事时而热闹,时而安静,时而癫狂,时而悲凉。而所有故事的主角,都有一颗渴望幸福、追求美好、守护所爱的温暖心灵。那些用过的心计,说到底都是为爱付出的心意;那些笨拙的张扬,更多的是想要靠近时的羞涩或紧张;而有时候,决绝地离去,却满满深藏“想要你幸福”的情意……
  • 梦幻西游之将明神剑

    梦幻西游之将明神剑

    什么?龙太子不拿枪,还抢了剑侠客的剑?什么?唐玄奘竟然变成了女的?吃了她依然可以长生不老!什么?猴哥竟然只会打酱油!什么?猪哥竟然变异了,而且……还变性了!什么?小白龙竟然成了一条蛇!那么老沙呢在哪?……一行五人,从东海龙宫向西而行,究竟他们会遇到哪些磨难?而西方,等待他们的又是什么?五庄观、普陀山、阴曹地府等等,他们的前身又叫什么?
  • 大造梦者

    大造梦者

    陶渊明笔下的《桃花源记》,真实存在,当某一天世外桃源在现世重新开启,身怀绝技的秦朝人步入现世,一切从这里开始。。。。。。
  • 夏日独直,寄萧侍御

    夏日独直,寄萧侍御

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。
  • 文学回忆录

    文学回忆录

    本书是著名记者、作家、翻译家萧干的又一本回忆录。在本书中,萧乾先生详细地回忆了他的文学创作和心路历程,并阐释了他的文学创作观点,读者可以从中体会到他对世界与人生的意味深长的重新认识和深度思考,有很高的文学和数据价值。
  • 闵落大明

    闵落大明

    是偶然还是注定的一次巧合让安洛闵得到了一块玉佩从此她的命运发生翻天覆地的变化她一下子穿越时空来到了大明朝耀眼的当红少女偶像在这片明朝的天空用她的美丽以及聪慧征服了什么又得到了什么而她自己,又在这样一个时空中邂逅了怎样珍贵的东西爱情是否可以当作筹码来做赌注相信自己是不是可以突破所有的障碍这一切的机缘巧合一个十六岁的女孩该如何去承受何去何从长着翅膀的幸福要多么坎坷过后才能留住一切都即将由她来改变......情节虚构,切勿模仿
  • 雅银莎之悲伤

    雅银莎之悲伤

    雅银莎的悲伤,是我对我看过的动漫、小说、电视剧等模糊的朦胧美的总结故事。作者认为逝去的美丽容易让人感伤和迷恋,于是希望在回忆写作的过程中能将它捕获下来。
  • 逆天孤女:师父太妖孽

    逆天孤女:师父太妖孽

    被突然扔过来的转头砸死,林语穿越到了一个莫名的世界,成为了一个五岁大的孤儿。这天底下应该没人比她死得尴尬了吧......本来想平平淡淡的过完这一生,却被从天上掉下来的美男捡了回去。什么,这个美男是仙人?