用户名 密码 看不清?点击更换 看不清?点击更换 忘记密码 注册   加入收藏  
 
 
博弈行为中的演绎与归纳推理及其问题(1)-逻辑学
来源:  作者:潘天群  点击:次  时间:2001-12-15 00:00于哲学网发表

     在这里,司马懿归纳作出了一个错误的策略选择。尽管如此,我们不能说司马懿是不理性的。司马懿作出错误的策略选取,是由于不完全信息造成的。在孔明-司马懿的博弈中,孔明做出的空城假象,目的就是让司马懿感到“攻城”有较大的失败的可能。如果我们用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主观概率。此时,在司马懿看来,“攻城”失败的可能性较大,而“撤退”的期望效用大于“攻城”的期望效用。即:司马懿认为,“攻城”的期望效用低于“撤退”的效用。诸葛亮惟有通过这个办法,才能让司马懿退兵。
    (4)动态博弈中的归纳推理 下面我们来分析“酒吧问题”中人们是如何运用归纳推理的。“酒吧问题”是一个重复性的动态博弈。
    “酒吧问题”(bar problem)是美国人阿瑟(W.B.Arthur)提出的。阿瑟是斯坦福大学经济学教授,同时是美国著名的圣塔菲研究所(Santa Fe lnstitute)研究人员。他不满意经济学中人们所认为的,经济主体或行动者(agents)的行动是建立在演绎推理基础之上的观点。他认为人们的行动是基于归纳的基础之上的。“酒吧问题”就是阿瑟为了说明他的这个观点而提出的。
    在1994年《美国经济评论》的题为《归纳论证和有界理性》一文中阿瑟提出了“酒吧问题”博弈,后来在1999年的著名的《科学》杂志上题为《复杂性和经济》一文又阐述了这个博弈。
    酒吧问题是指这样一个博弈:有一群人,比如总共有100人,每个周末均要决定,是去附近的一个酒吧活动还是呆在家里。该酒吧的容量是有限的,比如空间是有限的,或者座位是有限的。我们假定酒吧的容量是60人,或者说座位是60个。如果去酒吧的人数少于60,并且他也去了,他的决定就是正确的;或者,如果去酒吧的人超过60人,而他没有去——当然这只有事后才知道,他的决定也是正确的。否则,其决定是错误的。
    这里,我们假定他们之间不存在信息交流。我们看到,每个人根据对总的去酒吧人数的预测,而决定去酒吧与否。如果他预测去酒吧的人数超过60人,他将做出“不去酒吧”的决定,如果其预测不超过60人,他将做出“去酒吧”的决定。他们是如何做出预测呢?
    每个参与者或决策者面临的信息只是以前去酒吧的人数,每个参与者只能根据以前去的人数的信息“归纳”地得出一个规律。根据这个规律,参与人预测下次去酒吧的人数,从而决定自己去还是不去。
    这是一典型的动态博弈问题。假定,前面几周去酒吧的人数如下:
    44,76,23,77,45,66,78,22……
    不同的行动者可根据过去的历史“归纳”出某个规律,从而做出预测。例如预测:下次的人数将是前4周的平均数(53);两点的周期环(78);与前面隔一周的相同(78)……。
    通过计算机的模型实验,阿瑟得出一个有意思的结果。当不同的行动者根据过去的历史而进行行动时,去酒吧的人数没有一个可预测的固定的规律。然而有这样一个“规律”:经过一段时间以后,“平均去酒吧的人数总是趋于60”。即,经过一段时间,这个系统中的人群“去”与“不去”的人数比是60:40。尽管每个人不会固定地属于“去”或“不去”的人群,但这个系统的这个比例是不变的。阿瑟说,预测者自组织到一个均衡类型或生态均衡系统。这100人构成的系统是一个混沌系统(混沌系统的行为是不可预测的)。
    这就是酒吧问题。在这个问题中,每个参与人根据历史数据进行归纳并进行预测,然而,对于下次去酒吧的确定的人数,参与人是无法作出肯定的预测。例如,有趣的是,如果许多人均预测去酒吧的人数多于60,而决定不去酒吧,此时酒吧的人数将少于60。他们的预测则错了。如果许多人预测去酒吧的人数少于60,这些人去了酒吧,此时去酒吧的人数多过60。他们的预测也错了。
    附图
    因此人们要作出“正确的”预测,他要知道其他人如何作出预测的。但是在这个问题中每个人的预测的信息来源是一样的,即都是过去的去酒吧的人数。每个人不知道别人如何作出预测的信息。因此,所谓“正确”预测是没有的。每个人只能根据以往历史“归纳地”作出预测,而无其他办法。阿瑟教授提出这个问题,是强调在实际中归纳推理与行动之间的实际关联。
    利用归纳法的另外的例子是寡头垄断厂商之间的博弈。如果一个行业被多个寡头厂商所垄断,他们之间的竞争也是一个重复性的动态博弈。寡头厂商要确定自己最优的生产产量,但它们无法知道其他企业的产量。每个企业只能根据过去其他企业的生产产量来“推测”它们将要生产的产量,从而确定自己的最优产量。这个产量是最优的?不一定。如果是,它们就不调整自己的产量,如果不是,他们还要不断地调整。这同样是一个“归纳”和“调整”的过程。
      3 演绎推理的一个悖论:逆向归纳法悖论
    逆向归纲法是演绎推理,它是求解完全且完美信息下的动态博弈的方法。逆向归纳法推理严密。然而,将看到,逆向归纳法面临着致命的缺陷:悖论。
    让我们来看一个蜈蚣博弈(centipede game)的例子。
    蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。它是指这样一个博弈:两个参与者A、B轮流进行策略选择:可供选择的策略有“合作”和“不合作”两种。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为一有限次,比如198次。假定这个博弈的各自的支付给定如下:
    附图
    蜈蚣博弈
    上图中,c表示“合作策略”,nc表示“不合作”。
    在这个博弈中的参与人A、B是如何进行策略选择的?
    这个博弈形状像一只蜈蚣,而被命名成蜈蚣博弈。这个博弈奇特之处是:当A决策时,他考虑博弈的最后一步即第198步:B在“合作”和“不合作”之间作出选择时,因“合作”给B带来i00的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“不合作”。但是,要经过第197步才到第198步,在197步,A考虑到B在第198步时会选择“不合作”——此时A的收益是98,小于B合作时的100——那么在第197步时,他的最优策略是“不合作”——因为“不合作”的收益99大于“合作”的收益98。……如此推论下去。最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1!远远小于大家都采取“合作”策略时的收益:A:101,B:99。
    根据逆向归纳法,结果是令人悲伤的。从逻辑推理来看,逆向归纳法是严密的。但结论是违反直觉的。直觉告诉我们,一开始就停止的策略A、B均只能获取1,而采取合作性策略有可能均获取100,当然A一开始采取合作性策略有可能获得0,但1或者0与100相比实在是太小了。直觉告我们采取“合作”策略是好的。而从逻辑的角度看,A一开始应选择“不合作”的策略。
    是逆向归纳法错了,还是直觉错了?
    似乎逆向归纳法不正确。然而,我们会发现,即使双方开始能走向合作,即双方均采取合作策略,但这种合作不会坚持到最后一步。理性的人出于自身利益的考虑,肯定在某一步采取不合作策略。逆向归纳法肯定在某一步要起作用。只要逆向归纳法起作用,合作便不能进行下去。
    因此,我们不能怀疑逆向归纳法的合理性,它的推理过程严密,符合逻辑。然而如果我们用逆向归纳法来求解蜈蚣博弈,则博弈结果是我们不能接受的。
    许多博弈论专家认为,蜈蚣博弈所反映的不是悖论,逆向归纳法作为求解动态博弈的方法,是有效的。蜈蚣博弈的结果尽管不是我们所期望的,但它是均衡结果。这个均衡结果反映的是多主体下个体理性的局限。这是理性的困境。
      4 博弈行为中归纳推理的“合理性”问题
    休谟告诉我们,人们使用归纳法寻求自然现象之间的因果联系的这个过程,只不过是人的心理上的习惯联想。我们有什么其他理由认为,我们所认为的事物之间的所谓因果联系是必然的?这就是休谟问题。休谟质疑的是认识中的归纳法的合理性问题。在博弈行为中,归纳推理同样存在是否合理的问题。
    我们用归纳法对自然进行认识,并根据我们归纳的结果做出相应的行动。如:我们看到天空中乌云密布,风渐渐地大了,我们想,天可能要下雨了,我们要带伞。之所以有这样的认识,是因为以往的经验“告诉”我们:当乌云增多并刮大风时,意味着要下大雨。即,当我们面对自然现象时,我们根据过去的经验来归纳并采取相应的行动。
    在认识论中,我们知道,归纳推理所得出的结论是或然的。但是在认识中我们存在着这样一个信念:全称命题要么真、要么假,并且它是超越时间和空间的。我们用归纳法可以不断地接近真理。在互动的博弈中,理性的人运用归纳法进行推理时,归纳法是否有效?它的合理性在哪里?
    在“酒吧问题”中,我们凭什么说,以前去酒吧的人数与下次去酒吧的人数之间有联系呢?当某人进行预测时,只有当他知道其他人预测的方法,他才能根据以往的人数和其他人的预测方法来“正确地”预测下次去酒吧的人数。这样的预测才能是“有根据的”或者说“有理由的”。但我们除了能知道以往去酒吧的人数外,我们无法知道其他人的预测的方法。即使我们知道了其他人的预测方法,但当其他人知道了我们将根据他们的预测方法来预测时,他们将改变他们的预测方法,从而使我们的预测归于无效。
    在酒吧问题上,我们通过归纳法无法准确预测下次去酒吧的人数,那么我们通过对过去的历史能够知道什么?或者,在更一般的意义上说,在博弈行动中,人们通过归纳法能够学习到什么东西?这就是归纳法的合理性问题。
    我们发现,在博弈中归纳法的有效性体现在参与人对博弈均衡的认识。即通过归纳性的学习,博弈参与人对该博弈均衡获得了认识,对其他参与人的均衡策略也获得了认识。
    任何一个博弈均存在均衡,这也是诺贝尔经济学奖获得者约翰·纳什的贡献,被称为纳什均衡存在定理。然而,这里的均衡有两类:一类是纯策略均衡,另一类混合策略均衡。归纳法的作用就是对这两种均衡的认识。
    当一个博弈存在惟一一个纯策略纳什均衡点时,并且该博弈是完全信息博弈,参与人在一次博弈中就可达到均衡点。但当博弈不是完全信息博弈时,博弈参与人通过多次博弈,“了解”其他参与人不同策略组合下的得益,一旦策略组合达到了纳什均衡,博弈方均无意改变策略。因为此时,这一点是博弈各方均能够接受的点。在这样的过程中,参与人通过归纳法认识到该策略均衡,同时认识到其他参与人的策略选择。
    如果不存在纯策略均衡,而只存在混合策略均衡,博弈参与人通过归纳法同样能够认识到该混合策略均衡,同样能够认识其他参与人的策略选取,但此时是一混合策略,即参与人在其策略空间上的一个概率分布。在酒吧问题的博弈中不存在“纯策略纳什均衡”点,此时的参与人通过归纳法“认识到”平均去酒吧的人数为"60%",即每次去酒吧的人数与不去酒吧的人数的“可能”比率为60:40。
    因此,当一个博弈存在纯策略纳什均衡时,博弈各参与人通过对以往的博弈历史的归纳,制定出下次的策略均衡点,从而摸索着接近该均衡,最终达到一个纯策略。而当博弈存在混合策略均衡时,博弈参与人所能够做的只是逐渐认识对方的混合策略,而相应地制订自己的混合策略,最终达到混合策略均衡。
    这就是说,博弈中参与人运用的归纳推理是有效的,这种有效性是针对博弈均衡的认识而言的。
      5 结语
    逆向归纳法悖论只是博弈论中一个悖论而已,归纳的合理性也只是多主体互动时理性人进行归纳推理的一个问题。博弈论涉及许多关于推理的逻辑“问题”。本人希望我国有更多的逻辑研究人员参与到博弈逻辑的研究中来,逻辑学家参与到博弈论的研究定能够结出丰硕的研究成果。
  


【参考文献】
    [1] 潘天群.博弈生存[M].北京:中央编译出版杜,2002.
    [2] Mamoru Kaneko,Tekashi Nagashima.Game Logic and lts Applications Ⅰ[J]. Studia Logica,vo157,1996.325-354.
    [3] Mamoru Kaneko, Takashi Nagashima. Game logic and ItsApplications Ⅱ[J].Studia Logica,vo158,1997.273-303.
    [4] Bermudez. Rationality and the Backwards Indution Argument[J].Analysis,1999,59(4):243-248.
    [5] Arthur. Inductive Reasoning and Bounded Rationality[J].American Economic Review, vo184,1994. 406.
    [6] Arthur. Complexity and the Economy [J]. Science, Vol 284,1999.5411.


 



哲学网编辑部 未经授权禁止复制或建立镜像
地址:上海市虹梅南路5800号2座416室 邮编:200241
ICP证号:晋ICP备 05006844号