登陆注册
10972900000002

第2章 认识博弈论(1)

博弈论,又叫对策论,是研究两人或多人之间竞争合作关系的一门科学。用我们日常的语言来说,博弈论就是研究在不同情境下的策略选择的一种理论。它既是经济学的一个重要学科,也是现代数学的一个新分支。

在经济学上,博弈论是一个非常重要的理论概念,通过使用严谨的数学模型来解决现实生活中的各种利害冲突问题。具体来说,博弈论是指某个个人或是组织,在一定的环境条件和规则约束下,依靠所掌握的信息选择并加以实施各自所倾向的行为或是策略,并从中取得相应结果或收益的过程。

博弈论思想古已有之,早在2000多年前,博弈论的原始思想即已萌芽。古代文献中不乏充满博弈思维的案例。《孙子兵法》、《三十六计》、《三国演义》等等,就不仅仅是军事著作,而且可以算是很好的博弈论教材,只不过还没有上升到现代博弈论的层次而已。

博弈论最初主要研究象棋、围棋以及赌博中的胜负问题。那时候,人们对博弈局势的把握只停留在经验层面上,并没有向理论化发展,其正式发展成一门学科则是在20世纪初。

1928年,美籍匈牙利数学家约翰·冯·诺伊曼证明了博弈论的基本原理,并与经济学家奥斯卡·摩根斯坦合作于1944年发表了《博弈论与经济行为》一书,提出合作博弈的基本模型,并将二人博弈结构推广到n人博弈结构。至此,博弈论被引入了经济领域,奠定了这一学科的基础和理论体系。人们都把诺伊曼和摩根斯坦的这部巨著看做是现代博弈理论诞生的标志。

目前,博弈论作为分析和解决冲突和合作的理论工具,已经在管理科学、国际政治、经济、外交和社会学等领域得到广泛的应用,为解决不同实体的冲突和合作提供了宝贵的方法,并日渐发展成为一热门学科。

博弈的三要素

任何一局博弈都至少包含以下三个基本要素:

——决策主体决策主体,又译为参与者、局中人或博弈者。在一场竞赛或一局博弈中,每一个有决策权的参与者构成一个决策主体。

决策主体的目的是通过选择行动或者战略以使自己的效用水平最大化。只有两个决策主体的博弈现象称为两人博弈,多于两个决策主体的博弈称为多人博弈。一局博弈中的决策主体可以是自然人,也可以是团体:如企业,国家等。

——策略策略,又译为战略,即决策主体在给定信息的情况下的行动规则,它规定了决策主体在什么时候采取什么行动。

一局博弈中,每个决策主体都会选择实际可行的、完整的行动方案。一个可行的自始至终地对全局进行筹划的行动方案,称为这个决策主体的一个策略。如果在一局博弈中决策主体的策略是有限的,就称为有限博弈,相反则称为无限博弈。

——效用效用,又叫做支付,是指在一个特定的策略组合下,决策主体得到的确定效用水平,或者说是期望效用水平。简单来说,效用就是指进行博弈的付出或者收益。效用是所有决策主体真正关心的东西,每个决策主体在一局博弈结束时的效用,不仅与该决策主体自身所选择的策略有关,而且与全部决策主体所取定的一组策略有关。一局博弈结束时每个决策主体的效用是全体决策主体所取定的一组策略的函数,通常称为支付函数。

博弈的分类

博弈可以从多个角度进行分类。

——按照博弈各方是否同时决策,博弈可以分为静态博弈和动态博弈静态博弈是指在博弈过程中,参与者同时决策或同时行动,或者尽管决策或行动有先后顺序,但后行动者并不知道先行动者采取了什么具体的决策或行动。比如说工程招标(排除标书泄密的违规行为),其截止日期是6月1日,尽管有的竞标者在5月上旬就投了标,有的竞标者到5月下旬才投标,参与者的决策时间有先后之分,但效果却与同时决策是一样的。

动态博弈是指在博弈过程中,参与者的行动有先后顺序,并且后行动者可以观察到先行动者所采取的行动。

——按照参与者对其他参与者的了解程度,博弈可以分为完全信息博弈和不完全信息博弈完全信息博弈是指在博弈过程中,每一位参与者对其他参与者的策略空间、策略组合及收益信息有完全的了解。

如果参与者对其他参与者的策略空间、策略组合及收益信息了解得不够确切,或者说并没有掌握所有参与者的策略空间、策略组合及收益信息,在此种情况下进行的博弈就是不完全信息博弈。此时,参与者所做的是努力使自己的期望支付或期望效用最大化。

——按照参与者能否形成约束性的协议以便集体行动,博弈可以分为合作博弈和非合作博弈合作博弈是指所有参与者都从利己的角度出发,与其他参与者进行谈判并达成具有约束力的协议或形成联盟,参与者在协议范围内进行的博弈,其结果对联盟各方均有利。合作博弈主要研究人们达成合作时,如何分配合作得到的收益,即收益分配问题。

合作博弈强调团体理性、效率、公平和公正。典型的合作博弈是某一行业的寡头企业之间的串谋行为,即企业之间通过公开或者私下签订协议,对各自的价格或产量进行约束,以达到获取更多垄断利润的行为。

反之,不能强迫其他参与者遵守某一协议,各参与者只能选择自己的最优战略的,则属于非合作博弈。非合作博弈主要研究人们在利益相互影响的局势中如何选择决策,使自己的收益最大,即策略选择问题。

非合作博弈强调个人理性、个人最优决策。下面将要讲到的囚徒困境就是典型的非合作博弈。因为非合作是当今社会中利益博弈的常态,所以非合作博弈是博弈论探讨的主要内容。

非合作博弈按照参与者对其他参与者的信息掌握程度和博弈各方采取行动的顺序,可以分为四种不同的类型,即:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。这四类博弈一个比一个精彩,也一个比一个难。

完全信息静态博弈——是指在博弈过程中,所有参与者事先达成一项具有约束力的协议,规定每个决策主体的行为规则。如果在没有外在强制性约束时,各参与者自觉遵守该协议,没有人偏离协议规则,就构成一个纳什均衡(概念见第2章)。只要有一个参与者违背协议规定,则此协议就不构成纳什均衡,就不可能自动实施,不满足纳什均衡要求的协议是没有任何意义的。

完全信息动态博弈——动态是世间万物的基本特征,而静态只是一种独特的理想状态。在现实生活中,当一个参与者后采取行动时,自然会根据先前参与者的选择而适时调整自己的决策,而先采取行动的参与者也会理性地预期到这一点,所以也会考虑到自己的选择对其他后行动参与者的影响。

不完全信息静态博弈——是指参与者同时采取决策或者说决策虽然有先后顺序,但后行动者并不知道先行动者的决策,也没有机会观察先行动者的选择以调整自己的决策。每个参与者的最优策略只能是在给定自己的类型和他人类型依从策略的情况下,最大化自己的期望效用。

不完全信息动态博弈——是指各个参与者采取的决策有先后顺序,且后行动者掌握了前者的选择并获得了其偏好、策略空间及策略组合等信息,并依此修正自己的决策;而先行为的参与者也知道自己行为的效用对后行动者的影响,也会有意识地选择某种行动掩盖自己决策的真实目的。

博弈论是一门现实中非常有趣,理论上又颇有深度的学问。可以毫不夸张地说,了解博弈论知识对每一个现代人来说实在是太重要了。因为在现实社会中,每个人都在试图使自己的利益最大化,而在取得利益的过程中,往往会产生矛盾与冲突。利益均衡的实现主要取决于各自的策略选择行为,而策略选择问题实际上就是博弈论的本质所在。

多种立场,一个思想

囚徒困境最早是由美国普林斯顿大学数学家塔克于1950年提出来的。他当时编纂了一个故事,意在向斯坦福大学的心理学家们解释什么是博弈论。后来经过发展,囚徒困境成为了博弈论中最著名的案例之一。

所谓囚徒困境,大意是这个样子的。有一天,某富翁在家中被杀,财物被窃。警方在侦破此案的过程中,抓到了汤姆、杰克两个犯罪嫌疑人,并从他们的住处搜出了被害富翁家中丢失的财物。面对呈现在眼前的物证,他们承认了自己的偷窃行为,但却矢口否认杀害富翁,辩称是先发现富翁被杀,然后他俩只是顺手牵羊偷了点儿东西。

针对两人的狡辩,警方对他们采取了隔离审讯。为了分化瓦解他们,检察官分别对两人说了以下一段话:

本来你们的偷盗罪证据确凿,可以就此判你们1年刑期。但是,根据将功赎罪制度,如果你主动坦白并且揭发同伙的杀人罪行,我们将对你进行从宽发落,判你无罪释放,但你的同伙要被判30年刑期。如果你顽抗到底,拒不坦白,而被同伙检举出你的杀人行为,那么你就要受到严惩,将被判刑30年,你的同伙将被无罪释放。当然,如果你们两人都坦白,那么你们都将只被判15年刑期。在这里,博弈的决策主体——汤姆和杰克各有两个选择,即坦白和抵赖。这两个嫌疑犯该怎么办呢?他们面临着两难的选择——坦白还是抵赖。显然最好的选择是两人都选择抵赖,都得到最好的结果——只判刑1年(杀人罪按照疑罪从无原则,证据不足无法成立,只能以偷盗罪各判每人1年徒刑)。但是由于两人处于隔离的情况下,没有串供的条件,所以他们不得不仔细考虑对方可能采取什么策略,以及对方采取的策略对自己有什么影响。

心理较量就这样开始了,汤姆和杰克都是绝对的精明人,都只在乎减少自己的刑期,并不关心自己的选择会对对方产生什么影响,对方因为自己的决策又将被判多少年刑期。

汤姆会这样推理:假如杰克选择抵赖的话,我只要坦白,马上就可以无罪释放,获得自由,而我若抵赖则要坐牢15年,显然坦白比抵赖要划算得多;假如杰克选择坦白的话,我若抵赖,则要坐30年牢,坦白却只坐15年牢,显然还是选择坦白为上策。所以说,无论杰克选择抵赖还是坦白,我的最佳选择都是坦白,还是坦白交代了吧。

同样,杰克也跟汤姆一样会算计,也会如此推理。囚徒困境之所以称为困境,就是因为这局博弈的最终结果对两个参与者来说都是最坏的,两个嫌疑犯双双选择坦白,结果皆被判刑15年。这对他们个人来说都是从自身利益出发的最佳选择,符合他们的个体理性选择。因为坦白交代者可能会被无罪释放,显然比自己抵赖可能会独自承受30年刑期要好。而原本对双方都有利的策略——两个人都抵赖,每人被判1年刑期就不会出现。囚徒困境是典型的非合作博弈的范例,为我们探讨合作是怎样形成的提供了极为形象的解说方式,其产生不良后果的原因是两个嫌疑犯都从利己目的出发,最终导致结果损人不利己,合作没有产生。反过来我们就可看到:彼此达成合作是最好的利己策略,但合作必须符合以下黄金定律:“己所不欲,勿施于人”。基于此基础之上的合作才能形成一个和谐的、良好的社会环境。

在囚徒困境中,最好的策略直接取决于对方所采用的策略,取决于对方所采取的策略为发展双方合作留出多大的余地。独立于对方所用策略之外的、从利己目的出发的、最好的决策是不存在的。

实际上,囚徒困境是现实生活中许多现象的一个抽象概括,有着广泛而深刻的意义。同一行业不同企业之间激烈的价格竞争就是典型的囚徒困境现象。在价格博弈中,只要双方都以对方为敌手,只关心自己的利益,那么不管对方采取怎样的决策,自己采取低价策略总会占便宜,就如同囚徒困境中的犯罪嫌疑人始终认为自己选择坦白为最佳决策一样,这就促使双方都采取低价策略。如可口可乐公司和百事可乐公司之间的价格竞争、各大航空公司之间的价格战,等等。

如果双方进行合作,共同制定比较高的价格,就可以避免无休止的价格大战并获得较高的利润。但是这些联盟往往处于利益驱动的囚徒困境之中,双赢也就成为泡影。不同企业之间五花八门的价格联盟总是非常短命,道理也就在这里。

合作,有时是利益需要

农村某地有一个只有上官、欧阳两户人家的小居民点。由于地处偏僻,交通不便,使得两户人家与外界的交流十分困难,急需修一条通向外界的好路。假设修这条路的成本为4个单位,每户人家从修好的这条路上获得的好处为3个单位。如果没有中间人协调,上官、欧阳两家就各自打着自己是否修路的小算盘:若两家共同出钱联合修路,每家平均分摊修路成本2个单位,则每户人家获得的好处为1(3-2=1)个单位;当只有其中一户人家出钱修路而另一家坐享其成时,修路的那户人家付出4个单位的成本,却只得到3个单位的好处,获得的纯赢利为-1(3-4=-1)个单位,也就是得不偿失,倒贴1个单位,结果是亏损的,而坐享其成的一家却仍然可以使用修好的公路(修路人并没有拥有道路的占有权,总不能因为修了路就不让邻居走),白白获得3(3-0=3)个单位的好处;如果上官、欧阳两家都不修路,两家的纯赢利皆为0。

对上官家来说,若欧阳家修路,我家也修路,会获得1个单位的好处,而我家不修路,则会获得3个单位的好处,显然修路是劣势策略;若欧阳家不修路,我家修路,则净亏损1个单位,而我家不修路,则不赢也不亏,修路还是劣势策略,因而上官家决定不出钱修路。同理,欧阳家也会选择不修路。最终修路博弈的结局将是:两家都不动手,大家都得零。这就应了英国历史学家麦考莱的一句话:

大家的事情反而无人管。一般情况下,若上官只有欧阳一家邻居,欧阳也只有上官一家邻居,他们两家多半会互帮互助,好好商量修路的问题,合力把路修好,大家都得到方便。但是如果出现极端情形,如两家有仇,那就另当别论了。但是,这两种情形都不在博弈论讨论的范围之内。如果不附加说明,博弈论讨论所牵涉的参与者,都是经济学上的理性人:他们并没有私人恩怨,也不是世代友好,而只是具有自私本性但并不刻意损害他人的人类一员。

公共品和私人品的性质不一样。私人品是纯属私有私用,别人很难占到什么便宜。但公共品就不一样了,不管由谁提供出来,大家都可以共享。典型的如公园里的长椅,只要有人出钱出力设置好了,所有行人都可以坐下休息,哪怕他没有为此作出丝毫贡献。那么,这长椅由谁来设置呢?恩惠于大家的公共事情又由谁来管呢?

同类推荐
  • 郑李锦芬职场日志

    郑李锦芬职场日志

    郑李锦芬是一个传奇式的人物。从香港政务处行政主任到安利香港的一名职员,再到执掌安利大中华及东南亚区的高级职业经理人,其职业生涯华丽无比。同时,她还是三个孩子的妈妈,家庭和睦,堪称职业与家庭平衡的模范。本书分为十二章节,每月一主题。从职抉择、职业习惯、做事与做人、领导与家庭事业平衡等方面解读郑李锦芬的职场经验。书中背景分析较为精练,便于阅读。行动指南则较为励志,具有感染力。适合忙碌的职场人士阅读。
  • 这辈子,该怎么活

    这辈子,该怎么活

    生命对我们每个人来说,只有一次,但是对生命的感悟却因人而异。短短数十载,人这辈子,该怎么活呢? 人这一辈子,活着是美丽的,尽管有时候活着有许许多多痛苦,但和死亡相比,人活着就是一种幸福,死亡犹如飘零的枯叶,没有生机,没有梦想,没有生存的目标,也无法散发出鲜活的清香,而活着还可以感受温馨的阳光,编织各种绚丽的梦幻。曾几何时,煎熬中苦撑度日的我们,不经意间已是雨过天晴,当初那似乎致命的阴霾全都化作了虚无。此时,你就会暗自庆幸“我还活着”!经历过死亡的洗礼,才知道活着有多么可贵!不曾哭过长夜的人,不足语人生。
  • 聪明女人成事的12张王牌

    聪明女人成事的12张王牌

    本书是成就女人生活与事业的秘典,涉及内容丰富,知识面广且可读性强,观念新颖并有极强的操作性,很多说话、办事的技巧,读者可以直接应用到生活当中,具有现实的指导意义,更多成事王牌尽在书中,赶快拿来一用吧。
  • 平和是一种境界

    平和是一种境界

    幸福其实很简单,幸福不要刻意去追求它,只要你对生活用心,幸福就会聚拢在你周围。幸福和不幸只隔着一张纸,当你用爱,用诚意,用勤劳做剪刀,为不幸剪一个缺口,那幸福就会从另一个方向涌出来。幸福是一种心态,恬淡,舒适,满足,存在于生活中任何的时刻。
  • 这样办事更周全

    这样办事更周全

    本书以办事为基本内容,主要介绍有关把事办得更周全的技巧和方法。
热门推荐
  • 现代鬼医

    现代鬼医

    一个中医世家,传儿不传女,但女儿却做了一个千年难得一遇的鬼医!是福是祸?是喜是悲?
  • 混沌之成神

    混沌之成神

    一片雨寂,是谁,划破了殇之泪?原本只是一个平白无奇的少年,却是因为盘古传承改变了自己的一生。
  • 重生之嫡女二小姐

    重生之嫡女二小姐

    相府小姐空有倾城之貌,却无女子之德。嫉妒长姐,暗害姨娘,对祖母不慈。粗俗不堪,无半点才情。一朝偶遇欧阳世子,芳心暗许屡屡纠缠。却被世子红颜知己陷害,落入水中身亡,落得个不知羞耻陷害他人的名声。醒后惊艳睁眼,陌生的环境,陌生的灵魂。本想安安静静混吃等死。却总有人不想她好过,既然她不舒服别人就休想过的安心。庶妹个个刁钻,那就撕开她们虚伪的美人皮。她的理想是做一只米虫,没想到却被一个妖孽的腹黑男看上。看穿越重生的她如何玩转古代,在异世绽放出属于她的光环。
  • 黑执事:主仆间的完美配合

    黑执事:主仆间的完美配合

    根据黑执事改编:19世纪的英国贵族,凡托络西家族的唯一的小女儿——夏雪*凡托络西。因为4年轻的大火烧毁了宅第,葬送了所有家人的性命。但她知道,这原本就是一场阴谋,有人要让凡托络西这个家族毁灭。于是她与恶魔艾莉丝(女性)定下了契约,帮助她复仇,最后吞噬掉她的灵魂。
  • 红色彼岸千面冷公主

    红色彼岸千面冷公主

    一场暴雪,造就一场华丽的复仇游戏,一个完美的恶魔。一场游戏,一场梦,恶魔的梦早已破碎,只留下一张面具和一个完美的傀儡。傀儡在天堂和地狱中徘徊,最终跌落地狱,化成恶魔。是什么让天使蜕变成恶魔,是什么开启这场华丽的复仇游戏,完美的恶魔寄来地狱的邀请函,让我们在地狱里寻找答案吧,恶魔欢迎你。
  • 血赤壁

    血赤壁

    这本书因为开的太赶了,所以有段时间断更了。小天打算重开一本,喜欢本书的读者,可以去看小天的新书,小天不会再让大家失望了。
  • 对症拔罐治百病

    对症拔罐治百病

    无论日常保健还是治疗疾病,都是一个与体内“邪”、“毒”、“瘀”对抗的过程,当“寒”、“热”等外邪侵入人体后,外邪和内患相结合就会导致机体气血阻滞,从而引发身体不适甚至病变。只有将“邪毒”彻底拔出,才能扫清体内瘀滞,增强机体免疫力,达到标本兼治的目的。本书特邀高级中医技师亲自示范,针对最常见的健康养生问题,向人们推荐最简易和科学的家庭拔罐方法,并配以标准的拔罐真人示范图以及食补方,让即使不懂医学的人也能轻松取得最佳疗效,从而获得真正健康的人生。
  • 倾世狂宠:爱妃我怕疼

    倾世狂宠:爱妃我怕疼

    当21世纪初三党的逗逼校霸叶小兔误入时空门,悲催的穿越到了一个架空的紫月梦国叶丞相府中的废柴嫡女大小姐身上后,坚持“既来之则安之,有了钱让贱人集体吃屎”的信念,努力赚钱,不惹是非。当冷酷冥王遇到她,被调戏,吃豆腐,腹黑的他当然不会让人如此调戏,于是在一个美丽的夜晚“内啥,冥王殿下,你说咱俩出去赏赏月多好,闷在……被子里算啥”“那你……光溜溜的在本王床榻上又是作甚?”
  • 傻夫家有良田千亩

    傻夫家有良田千亩

    别人穿越她穿越,可她为什么是穿到穷苦的农村?天呀,她生平最怕三姨太六姑婆这些琐事了!还有,别人的丈夫不是富可敌国就是匹敌一方,可她的非但不厉害,竟然,还是个痴呆的?!上天怎么可以这样对她!【情节虚构,请勿模仿】
  • 麒姝风华

    麒姝风华

    凭借一手高超的厨艺,魏麒姝在京城享负盛名,更被当今圣上封为天下第一厨,因着耿直率真的性格,与身份尊贵的六王爷不打不相识,由此展开了一段刻骨之恋,而六王爷时而温柔时而残忍的性格背后所背负的仇恨,师傅深深隐藏的秘密,宫内宫外的暗潮涌动,都让这段感情如风雨中的浮萍,岌岌可危,而江湖上一场更大的阴谋也在渐渐浮出水面。