blogjava-凯发k8网页登录

blogjava-凯发k8网页登录http://www2.blogjava.net/chenpengyi/category/2087.htmlmysql资料,java技术,管理思想,博弈论,ajax,xp极限编程,物流知识zh-cntue, 27 feb 2007 20:24:35 gmttue, 27 feb 2007 20:24:35 gmt60强盗分金算法及博弈分析http://www.blogjava.net/chenpengyi/articles/8586.html陈朋奕陈朋奕wed, 27 jul 2005 16:12:00 gmthttp://www.blogjava.net/chenpengyi/articles/8586.htmlhttp://www.blogjava.net/chenpengyi/comments/8586.htmlhttp://www.blogjava.net/chenpengyi/articles/8586.html#feedback2http://www.blogjava.net/chenpengyi/comments/commentrss/8586.htmlhttp://www.blogjava.net/chenpengyi/services/trackbacks/8586.html
强盗分金算法及分析
amiaq(如果再回到从前) 北大未名站 2003/3 
    数学逻辑有时会导致十分怪异的结论,这道难题已经流传了至少十年,恰好就属于这一类。
    一般的规则是,如果逻辑推理没有漏洞,那么结论就必定站得住脚,即使它与你的直觉矛盾。1998年9
月,加利福尼亚州帕洛阿尔托的stephen m. omohundro寄给我一道难题,它恰好就属于这一类。这难题已
经流传了至少十年,但是omohundro对它作了改动,使它的逻辑问题变得分外复杂了。
    先来看看此难题原先的形状。10名海盗抢得了窖藏的100块金子,并打算瓜分这些战利品。这是一些讲
民主的海盗(当然是他们自己特有的民主),他们的习惯是按下面的方式进行分配:最厉害的一名海盗提
出分配方案,然后所有的海盗(包括提出方案者本人)就此方案进行表决。如果50%或更多的海盗赞同此方
案,此方案就获得通过并据此分配战利品。否则提出方案的海盗将被扔到海里,然后下提名最厉害的海盗
又重复上述过程。
    所有的海盗都乐于看到他们的一位同伙被扔进海里,不过,如果让他们选择的话,他们还是宁可得一
笔现金。他们当然也不愿意自己被扔到海里。所有的海盗都是有理性的,而且知道其他的海盗也是有理性
的。此外,没有两名海盗是同等厉害的——这些海盗按照完全由上到下的等级排好了座次,并且每个人都
清楚自己和其他所有人的等级。这些金块不能再分,也不允许几名海盗共有金块,因为任何海盗都不相信
他的同伙会遵守关于共享金块的安排。这是一伙每人都只为自己打算的海盗。
    最凶的一名海盗应当提出什么样的分配方案才能使他获得最多的金子呢?
    为方便起见,我们按照这些海盗的怯懦程度来给他们编号。最怯懦的海盗为1号海盗,次怯懦的海盗为
2号海盗,如此类推。这样最厉害的海盗就应当得到最大的编号,而方案的提出就将倒过来从上至下地进
行。
    分析所有这类策略游戏的奥妙就在于应当从结尾出发倒推回去。游戏结束时,你容易知道何种决策有
利而何种决策不利。确定了这一点后,你就可以把它用到倒数第2次决策上,如此类推。如果从游戏的开头
出发进行分析,那是走不了多远的。其原因在于,所有的战略决策都是要确定:“如果我这样做,那么下
一个人会怎样做?”因此在你以下海盗所做的决定对你来说是重要的,而在你之前的海盗所做的决定并不
重要,因为你反正对这些决定也无能为力了。
   记住了这一点,就可以知道我们的出发点应当是游戏进行到只剩两名海盗——即1号和2号——的时候。
这时最厉害的海盗是2号,而他的最佳分配方案是一目了然的:100块金子全归他一人所有,1号海盗什么也
得不到。由于他自己肯定为这个方案投赞成票,这样就占了总数的50%,因此方案获得通过。
    现在加上3号海盗。1号海盗知道,如果3号的方案被否决,那么最后将只剩2个海盗,而1号将肯定一无
所获——此外,3号也明白1号了解这一形势。因此,只要3号的分配方案给1号一点甜头使他不至于空手而
归,那么不论3号提出什么样的分配方案,1号都将投赞成票。因此3号需要分出尽可能少的一点金子来贿赂
1号海盗,这样就有了下面的分配方案:3号海盗分得99块金子,2号海盗一无所获,1号海盗得1块金子。
   4号海盗的策略也差不多。他需要有50%的支持票,因此同3号一样也需再找一人做同党。他可以给同党
的最低贿赂是1块金子,而他可以用这块金子来收买2号海盗。因为如果4号被否决而3号得以通过,则2号将
一文不名。因此,4号的分配方案应是:99块金子归自己,3号一块也得不到,2号得1块金子,1号也是一块
也得不到。
    5号海盗的策略稍有不同。他需要收买另两名海盗,因此至少得用2块金子来贿赂,才能使自己的方案
得到采纳。他的分配方案应该是:98块金子归自己,1块金子给3号,1块金子给1号。
    这一分析过程可以照着上述思路继续进行下去。每个分配方案都是唯一确定的,它可以使提出该方案
的海盗获得尽可能多的金子,同时又保证该方案肯定能通过。照这一模式进行下去,10号海盗提出的方案
将是96块金子归他所有,其他编号为偶数的海盗各得1块金子,而编号为奇数的海盗则什么也得不到。这就
解决了10名海盗的分配难题。
    omohundro的贡献是他把这一问题扩大到有500名海盗的情形,即500名海盗瓜分100块金子。显然,类
似的规律依然成立——至少是在一定范围内成立。事实上,前面所述的规律直到第200号海盗都成立。 200
号海盗的方案将是:从1到199号的所有奇数号的海盗都将一无所获,而从2到198号的所有偶数号海盗将各
得1块金子,剩下的1块金子归200号海盗自己所有。
    乍看起来,这一论证方法到200号之后将不再适用了,因为201号拿不出更多的金子来收买其他海盗。
但是即使分不到金子,201号至少还希望自己不会被扔进海里,因此他可以这样分配:给1到199号的所有奇
数号海盗每人1块金子,自己一块也不要。
    202号海盗同样别无选择,只能一块金子都不要了——他必须把这100块金子全部用来收买100名海盗,
而且这100名海盗还必须是那些按照201号方案将一无所获的人。由于这样的海盗有101名,因此202号的方
案将不再是唯一的——贿赂方案有101种。
    203号海盗必须获得102张赞成票,但他显然没有足够的金子去收买101名同伙。因此,无论提出什么样
的分配方案,他都注定会被扔到海里去喂鱼。不过,尽管203号命中注定死路一条,但并不是说他在游戏进
程中不起任何作用。相反,204号现在知道,203号为了能保住性命,就必须避免由他自己来提出分配方案
这么一种局面,所以无论204号海盗提出什么样的方案,203号都一定会投赞成票。这样204号海盗总算侥幸
拣到一条命:他可以得到他自己的1票、203号的1票、以及另外100名收买的海盗的赞成票,刚好达到保命
所需的50%。获得金子的海盗,必属于根据202号方案肯定将一无所获的那101名海盗之列。
    205号海盗的命运又如何呢?他可没有这样走运了。他不能指望203号和204号支持他的方案,因为如果
他们投票反对205号方案,就可以幸灾乐祸地看到205号被扔到海里去喂鱼,而他们自己的性命却仍然能够
保全。这样,无论205号海盗提出什么方案都必死无疑。206号海盗也是如此——他肯定可以得到205号的支
持,但这不足以救他一命。类似地,207号海盗需要104张赞成票——除了他收买的100张赞成票以及他自己
的1张赞成票之外,他还需3张赞成票才能免于一死。他可以获得205号和206号的支持,但还差一张票却是
无论如何也弄不到了,因此207号海盗的命运也是下海喂鱼。
    208号又时来运转了。他需要104张赞成票,而205、206、207号都会支持他,加上他自己一票及收买的
100票,他得以过关保命。获得他贿赂的必属于那些根据204号方案肯定将一无所获的人(候选人包括2到
200号中所有偶数号的海盗、以及201、203、204号)。
    现在可以看出一条新的、此后将一直有效的规律:那些方案能过关的海盗(他们的分配方案全都是把
金子用来收买100名同伙而自己一点都得不到)相隔的距离越来越远,而在他们之间的海盗则无论提什么样
的方案都会被扔进海里——因此为了保命,他们必会投票支持比他们厉害的海盗提出的任何分配方案。得
以避免葬身鱼腹的海盗包括201、202、204、208、216、232、264、328、456号,即其号码等于200加2的某
一方幂的海盗。
    现在我们来看看哪些海盗是获得贿赂的幸运儿。分配贿赂的方法是不唯一的,其中一种方法是让201号
海盗把贿赂分给1到199号的所有奇数编号的海盗,让202号分给2到200号的所有偶数编号的海盗,然后是让
204号贿赂奇数编号的海盗,208号贿赂偶数编号的海盗,如此类推,也就是轮流贿赂奇数编号和偶数编号
的海盗。
    结论是:当500名海盗运用最优策略来瓜分金子时,头44名海盗必死无疑,而456号海盗则给从1到199
号中所有奇数编号的海盗每人分1块金子,问题就解决了。由于这些海盗所实行的那种民主制度,他们的事
情就搞成了最厉害的一批海盗多半都是下海喂鱼,不过有时他们也会觉得自己很幸运——虽然分不到抢来
的金子,但总可以免于一死。只有最怯懦的200名海盗有可能分得一份脏物,而他们之中又只有一半的人能
真正得到一块金子,的确是怯懦者继承财富。


陈朋奕 2005-07-28 00:12
]]>
信息经济学与人生博弈http://www.blogjava.net/chenpengyi/articles/7469.html陈朋奕陈朋奕sun, 10 jul 2005 14:13:00 gmthttp://www.blogjava.net/chenpengyi/articles/7469.htmlhttp://www.blogjava.net/chenpengyi/comments/7469.htmlhttp://www.blogjava.net/chenpengyi/articles/7469.html#feedback0http://www.blogjava.net/chenpengyi/comments/commentrss/7469.htmlhttp://www.blogjava.net/chenpengyi/services/trackbacks/7469.html转载自《信息产业报》2000年6月26日以《信息经济学与人生博弈》董志强 1999-7

       
        在博弈论里面,信息是一个非常重要的概念。现代经济学最为激动人心的领域之一的信息经济学就建立在博弈论的基础上。 虽然信息在信息经济学中有严格的定义,即:信息就是知识差。但是既然我们现在不是讨论学术,所以您也不妨就把信息理解成为您平时所理解的信息,没有关系——这不过意味着你理解的信息比信息经济学里的信息范围更宽一些而已。

  信息对生活的影响是深刻的。从人们赶时髦的一些流行的提法诸如信息经济、知识经济、信息战我们就可以感觉到。更有一些走极端者竟然量出了这样的观点:知识经济的出现彻底否定了斯密以来的两百多年积累和发展起来的经济学理论。从人类历史以来,人们从来没有象现在这样深刻地意识到信息对于生活的重要影响。也从来没有任何一个时代象现在一样,报纸漫天飞,广告遍街是,电台电视台频道不计其数,互联网更是把触角伸向世界每一角落——您每天都在信息的狂轰烂炸下苟延残喘!

  信息实际上也是知识,拥有某方面信息就是拥有某方面知识。比如,你拥有一条信息是甲商场货品比乙商场货品便宜,就相当于你拥有“知道在甲买东西更便宜”的知识。信息是重要的,在商业争斗、军事战争、政治角逐中都表现得十分明显。《孙子兵法》云:知己知彼,百战不殆。这说明掌握足够的信息对战斗的好处是大大的。 在生活的“游戏”中,掌握更多的信息一般会有好处的。比如,你要恋爱,你得明白他(她)有何所好,然后才能对症下药投其所好,不至于吃闭门羹。你猜拳行令(南方的人们喜欢在喝酒时猜拳助兴),如果你知道对方将出什么,那你绝对赢。

  信息是否完全会给博弈带来不同的结果。有一个劫机事件的例子(张维迎,1996)可以说明。假定劫机者的目的是为了逃走,政府有两种可能的类型:人道型和非人道型。人道政府出于对人道的考虑,为了解救人质,同意放走劫机者;非人道政府在任何时候总是选择把飞机击落。如果是完全信息,非人道政府统治下将不会有劫机者(这与现实是相符的,在汉武帝时期,法令规定对劫人质者一律格杀勿论,有一次一个劫匪绑架了小公主,武帝依然下令将劫匪射杀,公主也死于非命,但此后国内一直不再有劫人质者),人道政府统治下将会有劫机者。但是,如果想劫机的人不知道政府的类型,那么他仍然有可能劫机的。所以我想,一个国家要防止犯罪的发生,仅有严厉的刑罚是不够的,还要让人民了解那些刑罚(进行普法教育)。因为,他不知道会面临刑罚,他就不会用那些规则来约束他的行为。在我国,法盲是很多的,许多悲剧也正是因为不了解法律而酿成的。加里·贝克尔认为影响个人犯罪的因素有被发现的概率和处罚的严重程度,我认为还要加上个体对法律的了解程度这一项——这表明,进行普法教育是重要的。更进一步讲,一项制度要规范人们的行为,必须要使人们具备关于这项制度的“共同知识”。比如,规定“车辆右行”的交通规则,就必须使每个司机都具备“车辆右行”的知识,否则交通仍是混乱的。你当然可以对不守规矩的司机进行处罚,是其明白自己的错误从而具备“车辆右行”的知识,那么可能的结果是,每个司机被处罚一次后,“车辆右行”才成为共同知识——与其这样,还不如一开始就对申请驾照的人进行交通知识教育。总之,对人们进行关于“制度”的知识教育是重要的。

  在上面的劫机案例中,非人道主义的政府最好把自己的信息传递给所有的人民,才能使劫机现象不发生。生活中,作为个人而言,有时候也需要把自己的信息传递给别人。比如求职,你就需要尽可能把你的优势长处展示给招募者。 教育程度就是你求职时需要向雇主传递的一个重要信息。大家应该还记得我们讲到过人力资本,那时我们认为较高教育水平劳动力具有较高的劳动生产率,因此所得报酬也较高。但一个叫斯宾塞的经济学家指出:教育水平只是一种信号,可能并不与劳动生产率有相关关系。可以这样理解他的意思:接受教育水平较高的人常常是更具有学习能力的人,较高的教育水平传递了这么一个信息,我具有较强的能力。作为企业,当然更愿意雇佣能力较强的人,于是教育程度就成了企业过滤人才的一个标准。实际上,高教育水平也许并没有带来高产出。当教育程度作为一个信号的时候,我们就可以解释为什么那么多人要去争取一个文凭甚至伪造学历,而且许多企业单单看了求职者的文凭就决定录用而没有仔细去验证求职者的真实能力如何,直到最后才发现,自己接受的大学高材生原来是个高分低能之辈。

  教育为什么能作为一种信号,而且为什么需要这种信号?用“柠檬市场”原理可以解释。“柠檬市场”本身讨论的是旧车市场,现在我们以劳动力市场来进行同样的讨论。假设劳动力市场上的求职者质量只有两种:高质量和低质量。求职者自己知道自己是高质量还是低质量,但雇主不知道求职者是高质量还是低质量。假设:高质量求职者要求的薪资是500元以上,雇主愿意给高质量的求职者600元以下的薪资,即双方可以在薪资500~600元的区间达成交易;低质量的求职者要求的薪资在300元以上,雇主愿意给低质量的求职者的薪资在350元以下,即双方可以在薪资300~350元的区间达成交易。如果,信息是完全的,那么雇主将给高质量求职者开出500~600元的薪资,给低质量求职者开出300~350元的薪资。但是雇主没有信息区分求职者是高质量还是低质量,于是,为保险起见,以475((600 350)/2)元以下的薪资雇佣求职者——结果,高素质求职者将退出劳动力市场,因为雇佣价格低于他的劳动力最低供给价格;当雇主发现雇佣的求职者全是低素质的时候,他就会把薪资压到350元以下,整个劳动力市场就只有低素质求职者了,这就是“劣货驱逐良品”的效应。更一般地,如果假设劳动力质量服从于[0,1]间的连续均匀分布,我们还可以退出劳动力市场瘫痪的结果,即劳动力市场上没有劳动力供给。当然,在现实中,劳动力市场没有瘫痪的例子,但低效率却是常见的。显然,高质量的求职者为了获得满意的薪资,必须向雇主传递表明他是高质量劳动力的信息。人们选来选去,发现教育可以作为这样的信息,因为一般地接受教育越多,意味着拥有更多的知识,也意味着更具有学习的能力等。于是,大家看到,文凭在寻找一份满意工作的过程中发挥了重要作用。

  在劳动经济学中,有一个统计歧视理论,也支持了上述看法。雇主明明知道并非每一个受过高等教育的人的能力一定超过只受过初等教育的人(即存在某些只受过初等教育的人的能力高于某些受过高等教育的人的情况),但他在最初雇佣时开出的价格常常仍然依据学历来确定。因为,如果他不加分别地给予两者相同的工资,他将面临不利选择,分开等级给予工资虽然仍面临风险,但却可以将风险降低,其期望收益可以提高。

  上述描述的是一场雇主先行的博弈,教育作为一种信号。大家还可以想想看,如果假文凭泛滥,且雇主对文凭真假难辨,即文凭不再传递求职者具有高素质的信息,那么文凭在找工作过程中还能发挥重要作用吗? 现在你有大学文凭,但这个社会也有假文凭泛滥。所以,雇主常常还得考虑你的文凭的可信度(即真实程度)然后作出自己的决策。现在你可以向雇主表示:可以向你毕业的学校调查,如果文凭有任何水分,那么你甘愿接受高额的罚款。这就使你的文凭的可信度提高了,实际上你也并没有付出那笔罚款。这种行为在博弈论中称“承诺行动”。承诺行动可以改变博弈的结果。比如,红军和白军争夺一个小岛,如果红军誓死保卫小岛,白军就最好放弃进攻(有点穷寇勿追的味道),如果红军保卫小岛的决心并不坚定,白军就最好进攻。现在,红军就可以采取一个“承诺行动”,一上岛就砸掉船只,拆掉桥,显示出背水一战誓与小岛共存亡的决心,于是白军觉得红军誓死保卫小岛是可信的,最好放弃进攻。 与承诺有点相似的是“威胁”。它相当于“如果你不……我就……”。威胁可信,有助于改变博弈结果;威胁不可信,它无助于改变博弈的结果。《圣经(旧约)》上有个故事:两个妇女为孩子的所有权发生争执,到所罗门国王面前请求判决。一个妇女说孩子是自己生的,被另一名妇女抢去了;另一名妇女称孩子本来就是自己亲生的。于是国王命下人取来剑,说:“把孩子切成两半,让他们每人拿走一块。”结果一个妇女说:把孩子给她吧,不要杀了他。另一个妇女说:切吧,谁也别想要孩子。于是孩子判给了第一个妇女。在这个故事中,国王就采取了“威胁”。但是,如果那个假母亲意识到国王不可能真的杀掉孩子(即威胁是不可信的),国王还能知道谁是真的母亲吗?相反,春节期间走红的《绍兴师爷》里的方师爷就比国王聪明,他遇到一个同样的案子,但他的办法是让两个母亲把孩子往自己身边拉,谁抢到孩子归谁。结果,真母亲不忍看孩子受罪就放弃了,当然最后孩子判给了他。我认为,方师爷采用的激励机制比所罗门国王的激励机制更有效。 在生活当中,承诺、威胁也是一些常用的策略。比如,父亲阻碍女儿跟某男青年来往,女儿可以自杀威胁父亲,但是父亲会判断这种威胁是否可信。在商业斗争中,某些商家为了防止对手作某件事(比如降价),常常宣布保留采取进一步(报复)措施的权利,其实也是一种威胁,它或许只是恐吓,或许是真的。

  现在,即使你采取了一个承诺行动,向雇主许诺如果文凭有假则如何如何,但如果雇主认为你这个承诺是不可信的——是的,人家凭什么要相信你的空口声明呢?——那么,你又能怎么办?或许,你只有花更高的代价去传递更令人感到可靠的信息,比如说你可能会同意学校多收一点钱制造带有防伪标记的毕业证。这在商业经营中也比较常见,比如在以次充好盛行的情况下,高质量产品的销售商总会力图建立良好的商业信誉,这样,它就可以从商誉中获得好处:人们相信它的产品是高质量的,也愿支付更高的价格。是不是其他的次品销售商也可以建立商誉呢?一般地,高质量产品销售商建立的商誉可以长期带来收益;而次品销售商建立的商誉可能只有一次起作用,因为人们姑且相信它而购买一次产品,但随即发现买了次品,于是次品销售商的商誉就下降甚或不存在了。如果,把建立商誉的花费看作一项固定成本,那么良品销售商所花的费用可在长期分摊,而次品销售商的花费只能一次性回收(否则得不偿失)。因此,如果建立商誉得成本较大的话,次品销售商是不愿去建立商誉的。我们看到,许多良品的商誉都是花不小的代价建立的,有的甚至经过几十年才累积了一个品牌,而消费者对它们也格外信赖。相反,如果建立商誉的成本很小,那么大家都会建立“商誉”,结果等于谁也没建立商誉,消费者也不领情。比如,在大街上,我们看惯了“跳楼价”、“自杀价”、“清仓还债,价格特优”等招牌,这也是商誉,但谁相信它是真的呢? 向别人传递信息很重要,但隐瞒信息或宣布虚假的信息也很重要。比如前面提到的政府和劫机犯博弈的案例,人道政府最好就隐瞒自己的特性,并伪装成非人道政府,也可以实现没有劫机现象(如果是重复博弈可能人道政府难以隐瞒自己的特性,因为只要发生一次劫机,人道政府的特征就暴露了)。商战中,信息战是一种常用的伎俩。重庆通讯市场曾发生过一起案例说明了隐瞒信息的重要性。去年5月某日,中国联通重庆公司在报上突然发布广告:次日手机降价。中国电信重庆公司随即获悉这一消息,当天下午即商讨对策,晚上将电信手机降价方案送往报社立即发排。第二天清早,电信一些员工和雇佣的临时的广告派发员将电信手机即日降价的广告发往过往的行人。结果,电信打了一个漂亮的“后发制人”的仗。联通的失败在于,他们把谋划已久的降价商业秘密没有保守到真正的最后时刻,它为电信采取行动留下了时间空间。

  还有一个有趣的观点就是,我认为,那些没文化的“暴发户”的暴发,正好是建立在他们缺乏某一方面的信息上。信息即知识,当某个赢利机会到来的时候,没有文化的人看到的只是赢利机会,而拥有较多知识的人不幸还拥有了这样的知识:不可一风而上。于是没文化的人去了,赢得了利润,而知识分子坐失良机。这样的一个事实可以演化成下面一个博弈:
  假设有一个只市场,有两个人进行争夺。如果甲(知识分子)进入,乙(低文化者)也进入,那么造成过度进入,双方都亏损3000单位;如果甲进入乙不进入,则甲赢利1000单位,乙赢利0单位;如果乙进入甲不进入,则乙赢利1000单位,甲赢利0单位;如果甲乙都不进入,则甲、乙赢利都为0单位。博弈的报酬矩阵如下:   

               甲(知识分子)
             进入      不进入
乙(低文化者) 进入 -3000,-3000    1000,0
        不进入  0,1000      0,0

  这个博弈中,纳什均衡是(甲进入,乙不进入)或(乙进入,甲不进入)。即给定甲进入,乙就不进入,给定乙进入,甲就不进入。但是现在,乙不知道两人共同进入将导致双方亏损,他只看到进入的利润,于是他将不考虑甲的行为,采取进入行动;而甲,因为掌握太多的信息,包括知道乙“不知道两人共同进入将导致双方亏损”而必定采取进入行动,于是乙只好放弃进入。平时,我们讲知识分子做事总是顾虑太多,在这个博弈里面,我们看到正式知识分子的顾虑使社会产出最大(1000 0=1000),如果知识分子不顾虑,那么社会产出就因为混乱而降低了(-6000)。而且,知识分子牺牲自己的可能赢利机会来使社会产出最大化。所以,我一直认为知识分子是真正默默奉献的一个阶层,而社会的分配体系却很少考虑知识分子的牺牲。 但上述例子并不说明知识越多越不好。对个人而言,可能有时过多的知识反而使赢利机会被迫放弃,即信息越多并不必定越好。但对全社会而言,可以想一下,如果大家都缺乏知识和信息的话,结果是大家都“进入”,社会产出完全无效率——因此,具有更多的知识仍是必要的。

  我们一直强调信息的重要性,其实我们是想强调掌握信息的不同组合对博弈结果的影响是重大的。换句话说,博弈的均衡常常取决于知识结构。



陈朋奕 2005-07-10 22:13
]]>
求职欺骗博弈http://www.blogjava.net/chenpengyi/articles/7468.html陈朋奕陈朋奕sun, 10 jul 2005 14:11:00 gmthttp://www.blogjava.net/chenpengyi/articles/7468.htmlhttp://www.blogjava.net/chenpengyi/comments/7468.htmlhttp://www.blogjava.net/chenpengyi/articles/7468.html#feedback0http://www.blogjava.net/chenpengyi/comments/commentrss/7468.htmlhttp://www.blogjava.net/chenpengyi/services/trackbacks/7468.html转载自
董志强 1999-7
现在我们用博弈论来分析现实生活的一个现象:求职中的欺骗行为。这个例子旨在为读者将博弈论运用于分析社会现象提供一个例子。

  从事过人力资源管理工作的人都知道,招募新雇员可能是最易导致失败的工作之一。一名求职者在将来的表现可能有两种:胜任工作和不胜任工作;而招募方的甄选决策也有两种:接受某个求职者和拒绝某个求职者。这样,一次招募行为就面临下面四种结果:


            雇主
         接受     拒绝
求职者 将来称职  ⅰ      ⅱ
    将来不称职 ⅲ      ⅳ

  显然,ⅰ、ⅳ两种结果都是成功的。ⅱ、ⅲ两种结果却说明招募工作失败了。情况ⅱ意味着,雇主错误地拒绝了一个将来表现会比较成功的求职者,从而不得不花费更多的精力和财力去甄选更多的候选人,使甄选费用增加,同时也可能使组织名声受到破坏(比如,你拒绝的是一个妇女,完全可能被妇联指责为歧视妇女)。情况ⅲ意味着,雇主错误地接受了一个将来表现很差劲的人,这将给组织造成显著的成本费用,包括为该雇员支付的培训成本、员工无能造成的生产成本上升和赢利机会丧失,以及解聘此雇员的费用和选聘新员工的费用等。

  错误地拒绝或错误地接受一名求职者,都是雇员招募中面临的风险。不过,导致错误接受的因素较少且一般可以由雇主控制(如歧视、偏见等)。导致错误接受的因素较多且雇主很难控制它们,比如求职者有意夸大自己的能力,或者求职者某一方面突出给雇主形成胜任工作的错觉,以及求职者有意的信息隐瞒和诈骗行为等等,都可能导致雇主错误接受。这些因素中,求职者的信息隐瞒和诈骗最严重也最常见。

  事实上,求职者的信息隐瞒和诈骗行为一直是管理中的道德困境问题。比如,一名下岗女工为了应聘文秘工作谎称她曾受过专门训练(实际上她仅仅在培训班听过几次课),对她的这种行为应严厉指责吗?不过作为雇主,不论是同情还是指责她,显然都不能把她的话当作可靠信息,否则就会作出不利选择。

  问题是,许多的事实表明,很多的求职者都会有意进行信息隐瞒和信息诈骗。我们可以把招募和应聘看作雇主和求职者之间的一场博弈。求职者有两种策略:欺骗或不欺骗雇主;雇主也有两种策略:相信与不相信求职者。我们假设:求职者不欺骗而雇主相信,双方从彼此的坦荡与信任中可获得效用各5单位;求职者欺骗而雇主相信,那么求职者欺骗成功,获得10单位效用,雇主损失10单位效用(因为雇主可能因此作出错误的决策);求职者欺骗而雇主不相信,求职者的伎俩被识破获得效用0,雇主也未能从发现作弊中得到正效用,其效用也记为0;求职者不欺骗而雇主不相信,那么求职者因觉得冤枉丧失2个单位效用,雇主因没有相信实话也可能决策失误,丧失2个单位效用。下面就是这个博弈的报酬矩阵(每格第一个数字表示求职者的效用,第二个数字表示雇主的效用:

          雇主
       相信     不相信
求职者 欺骗 10,-10     0,0
    不欺骗 5,5     -2,-2

  当求职者不欺骗的时候,雇主的最佳选择是相信。但求职者预计雇主会相信的时候,便会采取欺骗。雇主一旦发觉求职者的欺骗行为就会采取不相信。在这个博弈中,求职者不欺骗而雇主相信带来的总体效用(5 5=10)最大,可惜它不是均衡点。只有求职者欺骗而雇主不相信才是一个纳什均衡。博弈的结果将是求职者欺骗,当然雇主也不会相信。这很好理解:假如现实生活中有人凭借欺骗的手段获得了职位(的确有这样的例子的,而且肯定很多,因为有媒体报道过有人曾伪造公文骗得了市委副书记职务,就更不要说一般的企业招募员工了),势必引起更多的人妄图走此捷径;而雇主一旦发觉更多的人开始有欺骗行为时就会采取审慎的态度,不会轻易相信求职的人们;面对雇主的不信任加剧,原来一些诚实的求职者也开始采取欺骗态度(因为反正你不会轻易相信我是诚实的,我干脆就就不诚实,而且别人骗得我也就骗得),于是更多的求职者不诚实;更多求职者不诚实又加剧了雇主对求职者的不信任……最后就到了我们的纳什均衡:求职者欺骗而雇主不相信。
  上述结论与现实情况是相符合的。生活中,人才市场的通常结果是:由于金钱、升官、新工作的名声等强烈诱惑,由于社会监督检查不力,越来越多的人企图通过“瞒天过海”的手段发迹;寻求工作的急迫心情使人们产生作弊的邪念;作弊成功的范例为进一步作弊推波助澜。我们不难看到这些事例:一个刑满人员为了求职隐瞒其服刑经历,一个高中生为了谋取较高的职位伪造学位证书或购买假文凭。有调查表明,70%以上的求职者在应聘中有信息隐瞒和信息诈骗行为。甚至您可以想想您自己,在您的求职书中真的没有伪造和故意夸大的部分吗?尽管您非常明白,聪明的雇主会看透您求职书的某些部分。学生常常被认为是很单纯的,但我的调查,大学毕业生在他们的求职书中往往言过其实,其文字的煽动性大于纪实性。

  对于求职中的欺骗行为我很有体会,我的大学同学大多在一些企业的人力资源管理部门工作,使我多少对求职中的欺骗都有些感受。发生在别人身上也就罢了,有的时候发生在你身上可能令你哭笑不得。比如我自己,以前有些朋友借我的毕业证和学位证去作假,没想到有一次弄假成真,我的名字被挂在一个单位的设计部门,“我”成了那儿的工程师可我自己居然还不知道,直到一年多以后才偶然地发现。好了,现在我的一切证件都不敢外借了。

  雇主可以不相信求职者,却不能不招募必要的雇员填充工作空位。面临求职者的信息隐瞒和欺骗行为,,他如何防范和规避可能发生的风险?

  我们可以假设求职者和雇主有各自的收益函数,然后讨论各种情况下的纳什均衡及其条件。不过那样太学术化,而且会使本书失去普通的读者。因此我省略了那样的做法。单单指出,雇主防范和规避求职者信息隐瞒或欺骗带来的招募风险的具体措施可包括两个方面:
①雇主应尽可能多掌握求职者的信息,以利形成正确判断,作出正确决策。这方面的工作包括向求职者毕业的学校及原雇主核实其工作情况,对雇员进行背景调查,以及利用其他一些可资利用的信息网络等;
②设法使求职者采取诚信态度。这一方面的内容包括
a.降低求职者欺骗成功的概率,打击其侥幸心理,比如采用申请表、笔试、绩效模拟和测验、工作抽样、面谈、专门的测评中心、履历调查、体格检查等多种手段进行甄选就是有效的办法,以及
b.增大求职者欺骗行为的成本(相当于降低求职者欺骗的效用),比如:出台有关制度,对求职者的重大欺骗行为予以制裁(如法律规定通过欺骗签定的劳动合同无效且须补偿受害方的损失);向求职者暗示强硬信息——说谎将失去就业机会;在面试中询问有关专业知识方面的问题,如果工作是技术性的,求职者的欺骗行为很容易暴露;实行“降格录用”,即“高学历低就业”,比如研究生先作本科生使用,本科生先作专科生使用,确有能力才提高其就业待遇;约定低报酬的考察期,有能力和绩效方正式录用,正式录用后给予经济补偿;让求职者明白,每一雇员都可能面临历史调查,一旦发现隐瞒和欺诈行为,将受到处理;健全内部劳动力市场,规范内部晋升、报酬等制度。

  此外,选择采取欺骗手段可能性相对较小的群体作为招募对象(如到学校招聘学生),也是一种规避风险的措施。

  当然,在不对称信息条件下,不管机制多么完善,代理人的机会主义行为都不可能完全消除。也就是说,我们将没有办法彻底使求职者的欺骗行为在这个世界上消失,虽然,使更多的人不要欺骗是可能的.



陈朋奕 2005-07-10 22:11
]]>
智猪博弈问题http://www.blogjava.net/chenpengyi/articles/7467.html陈朋奕陈朋奕sun, 10 jul 2005 14:10:00 gmthttp://www.blogjava.net/chenpengyi/articles/7467.htmlhttp://www.blogjava.net/chenpengyi/comments/7467.htmlhttp://www.blogjava.net/chenpengyi/articles/7467.html#feedback0http://www.blogjava.net/chenpengyi/comments/commentrss/7467.htmlhttp://www.blogjava.net/chenpengyi/services/trackbacks/7467.html        它出自张维迎教授的《博弈论与信息经济学》,讲的是猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按钮。按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。各种情况组合扣除成本后的支付矩阵可如下表示(没格第一个数字是大猪的得益,第二个数字是小猪的得益):

        小猪
      按    等待
大猪  按 5,1   4,4
   等待 9,-1   0,0 //注:此例中,谁去按按纽则谁后到;都去按则同时到。

  在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,小猪还是最好选择等待。即不管大猪选择按还是不按,小猪的最佳策略都是等待。也就是说,无论如何,小猪都只会选择等待。这样的情况下,大猪最好选择是按,因为不按的话都饿肚子,按的话还可以有4个单位的收益。所以纳什均衡是(大猪按,小猪等待)。

  这个例子是一个多劳不多得的例子。现实中这种情况是很普遍的,一些努力工作的人和不工作的人得到与付出并不相称。改革也有类似的情况,在改革过程中利益的转移必定使一部分人先富一部分人生活水平没得到改善,前一部分人更有改革的积极性。也就是说,改革往往由“大猪”推动,“大猪”越多,改革速度越快。这个例子也可以反映斯密的“看不见手”教条,本来大猪是追求自身的利益,结果给小猪也带来了利益。它也解释了“搭便车”行为,例子中的小猪是一个典型的“搭便车”者,因为它坐享大猪的成果。
  在这里我们可以联系一下第二章提到的科斯定理,如果我们严格界定产权,是可以改变这种状况的。
  比如,以法律的形式规定,大猪按出的饲料归大猪支配,小猪按出的饲料归小猪支配,那么大猪小猪都存在去按的动力和积极性。
  相反,产权不清晰,比如吃大锅饭的情况下,结果是不劳有获、劳而少获,有点类似一幅漫画——卖力的驴子挨鞭子(一只驴子拉着一辆车,车上是一个农夫和另外几头驴子,农夫的鞭子落在拉车的驴子身上催它快跑;这只驴子并没有错,它遭罪只因为它比别的驴子强壮)。于是人们工作的积极性没有了。我想,这也是为什么我国改革开放不久,就提出了废除“大锅饭”,砸碎“三铁”(铁饭碗、铁交椅、铁工资)的原因所在了。
  在智猪博弈中,无论大猪采取何种行动,小猪都是采取等待。我们把小猪的“等待”称为“占优战略”(有点“以不变应万变”的意思)。



陈朋奕 2005-07-10 22:10
]]>
博弈论简介http://www.blogjava.net/chenpengyi/articles/7466.html陈朋奕陈朋奕sun, 10 jul 2005 14:09:00 gmthttp://www.blogjava.net/chenpengyi/articles/7466.htmlhttp://www.blogjava.net/chenpengyi/comments/7466.htmlhttp://www.blogjava.net/chenpengyi/articles/7466.html#feedback0http://www.blogjava.net/chenpengyi/comments/commentrss/7466.htmlhttp://www.blogjava.net/chenpengyi/services/trackbacks/7466.html转载自——董志强 1999-6

  对于一些非数学专业和经济学专业的人们来说,博弈论可能是一个极为陌生的概念。事实上,就是一些经济学专业毕业的学生,他们的博弈论知识也十分有限,我自己也是这样,略知皮毛而已(不,甚至连皮毛都未能真正了解)。因为国内学者把博弈论运用于经济学研究不过是近几年的事,也不普遍,而且它本身的内容也博大精深。但在国外,博弈论已成为占据主流的分析工具,如果你不懂得博弈论,那么你会被认为是没有真正懂得经济学。 博弈论的提法可能太过于学术化,容易让人们退避三舍。其实它有一个非常通俗的名字——游戏理论(博弈论的英文名字叫做“game theory”,如果直译,就是“游戏理论”)。博弈论在我国还有一个名字,叫对策论。这些名字都很好理解,博弈字面意思就是赌博、下棋,赌博和下棋当然是游戏了,赌博和下棋的时候常常要千方百计地应付对手,自然是要讲究对策了。

  如果我们要进行一场游戏,首先肯定要有参加游戏的人,没有人参加,游戏就不会进行下去,游戏活动的参与人有一个学术名称叫“局中人”;其次,每一个“局中人”都有自己的“行动”,或者叫做“策略”、“对策”,如果行动不是单一的,那么这个局中人所有的行动构成一个集合,称行动组合或策略组合;另外,还应该约定输家要付出什么代价,赢家可获得什么利益,这在术语上叫做“支付”(或“报酬”)。当然,一场游戏肯定结果不是唯一的,各个参与人分散决策采取不同的行动,会造成不同的结果。但是纳什证明出,在有限个局中人参加的有限行为对策中,至少存在一个所有参与人的最优战略的组合,这叫做“纳什均衡”。处于纳什均衡状态下,每个人都不能通过改变策略来得到更大的收益,所以谁也不存在改变现状的动力。

  举一个具体的例子来说明一下。这个例子叫“囚犯困境”,是被一些教材广泛引用的例子,并且西方经济学者围绕这个例子发表过不下百篇学术论文。它是这样的(有兴趣的读者可参见青年经济学家张维迎的《博弈论与信息经济学》,这本书几乎成了经济学研究生的必读书):两个嫌疑犯(a和b)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白各判8年,如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年,如果都不坦白则因证据不足各判1年。

  在这个例子里,局中人就是两个嫌疑犯a和b,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:a和b均坦白或均不坦白、a坦白b不坦白或者b坦白a不坦白,是博弈的结果。a和b均坦白是这个博弈的纳什均衡。我们可以用下面的表来表述这个博弈,表中,第一个数字是a的支付(因为是判刑是负效用,故以负号记之),第二个数字是b的支付。


          囚犯b
        坦白   抵赖
囚犯a  坦白 -8,-8  0,-10
     抵赖 -10,0  -1,-1

  我们看到,假定a选择坦白的话,b最好是选择坦白,因为b坦白判8年而抵赖却要判十年;假定a选择抵赖的话,b最好还是选择坦白,因为b坦白判不被判刑而抵赖确要被判刑1年。即是说,不管a坦白或抵赖,b的最佳选择都是坦白。反过来,同样地,不管b是坦白还是抵赖,a的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,a和b都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

  张维迎指出,囚徒困境反映了个人理性和集体理性的矛盾。如果a和b都选择抵赖,各判刑1年,显然比都选择坦白各判刑8年好得多。当然,a和b可以在被警察抓到之前订立一个“攻守同盟”,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。

  “囚犯困境”在经济学上有很多应用,也有力地解释了一些经济现象。比如中东石油输出国组织(organization of petroleum exporting countries,简称opec)的成立,本身要限制各石油生产国的产量,以保持石油价格,以便获取利润。但成员国并不遵守组织的协定,每个成员国都这样想,只要他们不增加产量,我增加一点点产量对价格没什么影响,结果每个国家都增加产量,造成石油价格下跌,大家的利润都受到损失。当然,一些产量增加较少的国家损失更多,于是也更加大量生产,造成价格进一步下降——结果,陷入一个困境:大家都增加产量,价格下跌,大家再增加产量,价格再下跌……我们不妨考察一下历史:

  1960年,5个产油国成立欧佩克(opec)。1973年成员国扩大到13个。当时各国还少有产量欺骗行为。1973年,阿-以战争爆发,为了报复以色列和西方国家,opec突然大幅度削减石油出口,致使世界原油价格由$2.91/桶暴涨到1974年$10.77/桶。这一意外事件让opec看到了组建卡特尔的诱人前景。1978年伊朗发生革命,其石油生产一度陷于瘫痪,既而两伊战争爆发,许多石油设施受到破坏,世界石油价格进一步涨到80年代初的$40/桶。但是,高额的利润导致各个国家的产量欺骗行为(实际产量大于限产计划),即各国不再遵守产量协定,擅自提高产量以获取更大的市场和更多的利润,从而导致石油价格下跌——当然,价格下跌也与世界其他地区如墨西哥油田、阿拉斯加油田、北海油田等石油供给增加有关。1982年世界石油价格为$32/桶,1984年为$27/桶,1987年为$18/桶,以后基本上在$15-18/桶之间波动。

  理论上,几乎所有的卡特尔都会遭到失败,原因就在于卡特尔的协定(类似囚犯的攻守同盟)不是一个纳什均衡,没有成员有兴趣遵守。最近发生的一个案例再次证明了这一点。今年4月,长虹突然宣布彩电降价,对彩电业带来了巨大震动。随即,康价佳老总陈伟荣、tcl老总李东生、创维老总黄宏生达成默契:建立彩电联盟。直到4月20日下午,康佳仍表示不降价,但当晚陈伟荣突然改变主意,搞得李、黄措手不及。4月24日,本来三方准备坐下来商讨降价后的进一步策略,结果又是陈伟荣爽约。

  那么不可能有卡特尔合作成功了?理论上,如果是无限期的合作,双方考虑长远利益,他们的合作是会成功的。但只要是有限次的合作,合作就不会成功。比如合作10次,那么再第九次博弈参与人就会采取不合作态度,因为大家都想趁最后一次机会捞一把,反正以后我也不会跟你合作了。但是大家料到第九次会出现不合作,那么就很可能再第八次就采取不合作的态度。第八次不合作会使大家在第七次就不合作……一直到,从第一次开始大家都不会采取合作态度。

  当然,这只是理论上的分析。现实中影响人们决策和态度的因素很多,所以,有些博弈的结果并不体现为纳什均衡。在国外曾做过一个“囚犯困境”的实验,被实验者是素未谋面的一个男生和一个女生。开始,这个男生每次都选择“坦白”,这是符合纳什均衡的。后来实验者有意安排了一次喝咖啡的机会,使男生发现自己的对手是一个漂亮的女生。结果以后的测验中,男生每次都选择不坦白以获取女孩的好感。

  不过,不管怎样,博弈论都是一个强有力的分析工具。现在,它不仅在经济学领域得到广泛应用,在军事、政治、商业征战、社会科学领域以及生物学等自然科学领域都有非常重大的影响,工程学中如控制论工程也少不了它。我们举的例子,只是帮助大家形成博弈论的基本概念,实际上它是非常精深的。现在与它紧密联系的经济学分支是信息经济学。信号游戏、拍卖形式、激励机制、委托人—代理人理论和公共财政学是博弈论和信息经济学研究的重要课题。

  应该感谢美国数学家冯?诺依曼(von neumann)和摩根斯坦(morgenstern),是他们在《博弈论和经济行为》(1944)一书中提出了博弈论的经济思想。冯?诺依曼在数学、计算机、经济学等领域都有奇才般的贡献,可惜英年早逝。1950-1954年,美国数学家统计学家纳什接连发表多篇论述对策论的文章,奠定了现代博弈论学科体系的基础。



陈朋奕 2005-07-10 22:09
]]>
普林斯顿大学的一道习题http://www.blogjava.net/chenpengyi/articles/7464.html陈朋奕陈朋奕sun, 10 jul 2005 14:08:00 gmthttp://www.blogjava.net/chenpengyi/articles/7464.htmlhttp://www.blogjava.net/chenpengyi/comments/7464.htmlhttp://www.blogjava.net/chenpengyi/articles/7464.html#feedback0http://www.blogjava.net/chenpengyi/comments/commentrss/7464.htmlhttp://www.blogjava.net/chenpengyi/services/trackbacks/7464.html        题目:如果给你两个师的兵力,由你来当“司令”,任务是攻克“敌人”占据的一座城市,而敌军的守备力量是三个师,规定双方的兵力只能整师调动。

  通往城市的道路只有甲乙两条。当你发起攻击的时候,你的兵力超过敌人,你就获胜;你的兵力比敌人的守备兵力少或者相等,你就失败,那么,你将如何制定攻城方案?
  “司令”发牢骚躺倒不干:“为什么给敌人三个师的兵力,而只给我两个师?这太不公平,兵力已经吃亏,居然还要规定兵力相等则敌胜我败,连规则都不公平,完全偏袒敌人。”为此你也许会大为不满。来个躺倒不干。
  其实,这次模拟“作战”,每一方取胜的概率都是50%,即谁胜谁负的可能性是一半对一半。你这个司令能否神机妙算,指挥队伍克敌制胜,还得看你的本事。
  为什么说取胜的概率是一半对一半呢,让我们先学一点儿“纸上谈兵”。
  我们来分析一下:敌人有三个师,布防在甲乙两条通道上。由于必须整师布防,敌人有四种部署方案,即:
a、三个师都驻守甲方向;
b、两个师驻守甲方向,一个师驻守乙方向;
c、一个师驻守甲方向,两个师驻守乙方向:
d、三个师都驻守乙方向。
  同样,你有两个师的攻城部队,可以有三种部署方案,即:

a、集中全部两个师的兵力从甲方向攻击;
b、兵分两路,一师从甲方向,另一师从乙方向,同时发起攻击;
c、集中全部两个师的兵力从乙方向攻击。
  和以前一样,如果我们用“ ,-”表示我方攻克,用“-, ”表示敌方守住,就可以画出交战双方的胜负分析表:

       敌
    a  b  c  d
  a -, -, ,- ,-
我 b ,- -, -, ,-
  c ,- ,- -, -,


  假设你采取a方案,那么如果“敌人”采取a方案,你的两个师将遇到敌军三个师的抵抗,你要败下阵来,所以是(一,十);如果“敌人”取b方案,你的两个师遇到敌军两个师以逸待劳的抵抗,你也要败下阵来,同样是(一, );但是如果“敌人”取c方案,你以两个师打“敌人”一个师,你就会以优势兵力获得胜利,结果是(十,一);同样,如果“敌人”采取d方案,你攻在敌军的薄弱点上,你就能长驱直入,轻取城池,结果也是(十,一)。
  和以前的博弈表示略微不同的地方,是现在每个格子里面只有正负号,没有数目字。希望这不会使你感到不安。如果你还是喜欢有数目字,那也容易得很,每个正负号后面都加上同一个数目字就行,同一个1.同一个1944,或者同一个1998。要紧是表达出输赢。
  这你就知道,在上述表达中,正负号要紧,具体数目字无所谓。


诺曼底登陆模拟:取胜概率相等

  交战双方的胜负分析表画出来以后,从“+,一”的分布来看,似乎双方取胜的机会都一样大。一直看《博弈论平话》的读者,可以运用劣势策略消去法把它化简。
  实际做这个题目的时候,如果先从我方入手,一下子是分不出优劣来的。a和b,b和c,a和c之间,都说不上谁比谁优,谁比谁劣。于是,我们从敌方入手,尝试站在敌军的立场,比较策略a和b。如果我军采取策略a,敌军取a或b都会赢,结果一样。如果我军采取策略b,敌军取a会输取b会赢,如我军采取策略c,敌军取a或b都会输。可见,在敌军看来,策略b比策略a好:采取策略a会赢的话(如果我军取a),采取策略b一定也会赢;采取策略a会输的话(如果我军取b或c),采取策略b却不一定会输,因为假如我军取b,敌军就赢了。
  同样,策略c和d比较,c是优势策略,而d是劣势策略。

  智慧的或者说理性的局中人是不会采用劣势策略的,所以当做出博弈的矩阵表示以后,如果发现劣势策略,你就可以把它划去,这就是劣势策略消去法。


  现在,剩下上边那个三行两列的矩阵,六个格子中,(一, +)比(十,一)多,似乎敌方的赢面比较大,其实不然。因为到了敌方不会采用“笨蛋”策略的时候,到了敌方只剩下b和c两个较优策略的时候,我方的三个策略之中,原来不是劣势策略的b现在就变成劣势策略了。我们也不是笨蛋,所以我们也应该把b删去。最后,得到下边那个两行两列的矩阵博弈表示。


  情况最终就是这样:敌军必取b或c那样的二一布防,一路两个师,另一路一个师,而我军必集中兵力于某一路实施攻击,即a或c那样的攻击策略。这样,你若攻在敌军的薄弱处,你就获胜,你若攻在敌人兵力较多的地方,你就失败,总之,敌我双方获胜的可能性还是一样大,“司令”先生:不要躺倒不干,你不比对方吃亏。
  这虽然是一个模拟的例子,却具有相当的现实意义,诺曼底战役前的情况,大体也是这个样子。跨海作战,攻方能够调动来渡海作战的兵力,通常总是比守方可以用于守备的兵力少。模拟作战中假设攻方兵力力两个师而守方的兵力为三个师,就是这样的背景。另外,渡海登陆作战,通常至少在一开始的时候,攻方要承受很大的牺牲。模拟作战中规定若攻守双方兵力相等则攻方失败,体现了这个意思。



陈朋奕 2005-07-10 22:08
]]>
博弈论中常见的一些例子http://www.blogjava.net/chenpengyi/articles/7463.html陈朋奕陈朋奕sun, 10 jul 2005 14:07:00 gmthttp://www.blogjava.net/chenpengyi/articles/7463.htmlhttp://www.blogjava.net/chenpengyi/comments/7463.htmlhttp://www.blogjava.net/chenpengyi/articles/7463.html#feedback0http://www.blogjava.net/chenpengyi/comments/commentrss/7463.htmlhttp://www.blogjava.net/chenpengyi/services/trackbacks/7463.html  2、(entry deterrence市场威慑) 设某市场已被ⅱ方(场内者)占据,现i方(场外者)正在考虑是进去争夺(记为策略i1)还是不进去争夺(记为策略i2),而ⅱ方相应应考虑的是采取合作共享的态度(记为策略ⅱ1)还是采取坚决斗争的态度(记为策略ⅱ2)。
  3、(prisoner’s dilemma囚犯困境) 设有两个囚犯曾犯过大罪,现因犯小罪而被捕,正分别受警方审讯.这两个囚犯都明白:如果两人都拒不坦白犯过大罪,那么当局只能以当前的小罪而判处1年徒刑;要是两人都坦白犯过大罪,那么当局将判处9年徒刑;如果一人坦白,而另一人拒不坦白,那么坦白者将会立即获得释放,另一个将会被判处10年徒刑。(北京大学1999年研究生入学考试微观试题) 举出一个你在现实生活中遇到的囚犯两难困境的例子。
  4、(两寡头降价竞争) 这一模型,在数学结构上,与上例完全相同。设某一市场上仅有两个寡头,他们分别都可以选择降价与不降价两种策略。
  5、(打假) 设当局对商品采取查假行动的费用为a万元,查出假货后,罚款为b万元,且销毁的假货成本为c万元;若商人出售假货,而当局不采取查假行动,则商人可额外获利d万元,且社会的进一步损失为e万元。
  6、(监督博弈)设税务局查税的费用为a万元,查出逃税后,罚款为b(b>a)万元,纳税人应纳的税金为c万元。则税务局与纳税人的该两人非零和对策模型的赢得表具体如下。
  7、(boxed pigs智猪博弈) 设猪圈里有一个按钮与两只猪,大猪与小猪,按一次按钮,就会有10份食品进入,大猪与小猪同时吃的话,将分别能吃到7份与3份,但去按一次按钮,必须耗费a份食品,而且按按钮者,由于耽误了时间,还将少吃到2份食品。
  当1<a<5时,ⅱ2(等待)是小猪的占优策略,所以大猪只能采用策略i1(去按),于是,多劳者反而少得!这主要是小猪在此有机遇。
  当a>5时,“等待”既是小猪的占优策略,也是大猪的占优策略,所以变成了占优战略均衡,大家都等待,陷入困境。
  8、(两寡头产量竞争) 设某市场只有两个寡头厂商,其中厂商1与2的产量分别记为x与y,市场总产量记为 q:=x+y. 又设,厂商1与2的产量边际成本都恒为2,而且都没有固定成本,也即他们的成本分别为2x与2y。 再设,将这些产品全部销售出去的平均价格函数为 p=8-q.
于是,厂商1与2的利润分别为
  9、(北京大学1995年研究生入学考试微观试题,招生专业:国民经济学、产业经济学、金融学、企业管理、管理科学与工程) a、b两企业利用广告进行竞争。若a、b两企业都作广告,在未来销售中,a企业可以获得20万元利润,b企业可以获得8万元利润;若a企业作广告,b企业不作广告,a企业可以获得25万元利润,b企业可以获得2万元利润;若a企业不作广告,b企业作广告,a企业可以获得10万元利润,b企业可以获得12万元利润;若a、b两企业都不作广告,a企业可以获得30万元利润,b企业可以获得6万元利润。
  10、(北京大学1998年研究生入学考试微观试题,2003年浙江大学博士生入学考试微观试题) 家用电气市场上有两个厂商,各自都可以选择生产空调和彩电,彼此的利润如下列收益矩阵所示
  11、可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益); 利润的大小取决于双方的策略组合(收益函数); 博弈有四种策略组合,其结局是:
(1)如果双方都不涨价,各得利润10单位;
(2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;
(3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;
(4)如果双方都涨价,可口可乐利润140,百事可乐利润35;
博弈的稳定状态有两个:都不涨价或者都涨价(均衡),均衡称为博弈的解,它是由博弈规则(即参与者采取什么策略会取得什么结局,市场的需求弹性、交叉价格弹性等)决定的。
博弈论与诺曼底战役决策

陈朋奕 2005-07-10 22:07
]]>
网站地图