用户名 密码 看不清?点击更换 看不清?点击更换 忘记密码 注册   加入收藏  
 
 
博弈论与霍布斯问题——兼答陈晓平教授的批评(1)-科技哲学
来源:  作者:张华夏  点击:次  时间:2002-02-07 00:00于哲学网发表

     三、博弈论模型
二次世界大战后兴起的博弈论,讨论的是理性人的选择与相互对策问题,被誉为“社会科学的统一场论”。运用它来解决霍布斯问题,可以看出经济人是怎样能够变成伦理人的。本文的主要工作,就是运用博弈论来解决经济人变成伦理人的问题,运用博弈论力图将功利主义和道义论、功利原则和正义原则统一起来。
案例:典型的案例是囚犯困境。不过该案例讨论的是二人合作作案被缉捕后的招供还是不招供的理性选择问题,用以讨论伦理关系的形成虽没有逻辑障碍但有心理障碍,我将它改为A、B两个原始人合作捕杀猛兽。如A在战斗中逃跑待B擒得猛兽后又可坐享其成,因而对A 的利益来说这个对策的得分可记为10分。而B留下孤军作战, 虽也有捕获猛兽之机会但也有被猛兽咬伤之危险,权衡得失这个对策对B 的利益来说可记为0分。A、B同时逃跑,利用这段时间去采集野果、野菜之类, 虽然没有肉食但也不是一无所获,故二人在记分上均记为2分。而如果A、B 都坚守阵地合作战斗,可将猛兽打死,均分其肉,各记得分为6分。 这样在这个不确定的博弈中,A与B均有两种对策:1.逃跑,2.合作。他们的支付矩阵如下:

     A[,1](逃跑)  A[,2](合作)
B[,1](逃跑)│(2,2)   (10,0) │
B[,2](合作)│(0,10)   (6,6) │

这在博弈论中叫做二人不确定性非零和博弈。
就个人来说,最优选择是什么?是逃跑还是合作呢?以A为例, 如果B逃跑,A当然要选择逃跑(即方案A[,1],这里A可得2分), 否则他会得到0分。如果B采取合作态度,坚持战斗,则A 还是采取逃跑方针为佳。因为我逃跑此时可得10分,比坚持战争时得分6分还要大。同理B也采取了同样的方针,同样的对策。结果:A也逃跑,B也逃跑,大家只各得2分。很明显,从这个矩阵来看,如果A、B都采取合作的方针, 大家都会得到6分。显然后者才是最佳的(optimal)选择方案。这就是说,从个人角度看的最优方案,从整体角度看不是最大而是比较差的方案。这就是困境Dilemma就是“悖论”(系统论将它称为“整体悖论”)。 这里个人理性与整体理性发生矛盾。个人理性的结果,导致整体非理性,即支付函数值为(2,2),不是最优。而要获得整体的理性(6,6)导致个人的非理性(不是最优)的选择。这里,逃跑的方案代表A、 B 不受任何约束可以为所欲为,相当于霍布斯的自然状态。其结果是人类处于一种悲惨世界,即霍布斯所形容的贫穷、孤独、凶残、恐惧和短命的人生。当然它的得分很低,相当于这里的(2,2)。而A、B都坚持合作表示形成道德规范的状态,道德规范约束大家走向共同合作,其结果,整体利益达到最大化,即6+6>10+0>2+2, 相当于一种功利主义的目标。而不采取一方逃跑一方合作的方地,则相当于不采取损人利己的“解”,即不平等不正义方案A[,1]B[,2]或A[,2]B[,1],这相当于“平等的自由”和“平等的权利”,和将别人看作是目的而不只是看作手段的原则。
这样,“囚犯困境”或“合作狩猎”的支付矩阵的各个值的组合便有了它的伦理意义,可以写成如下的定性形式:

A       A[,1]           A[,2]
 B
B[,1] 个人理性:自然状态    不正义的选择:权利
    或原始状态        的不平等状态
B[,2] 不正义的选择:权利    集体理性:功利主义
    的不平等状态       和正义原则

现在的问题是:如何解决个人理性与集体理性的矛盾,使具有个人理性的人过渡到具有集体理性的人呢?如何从选择A[,1]B[,1]方案进展到A[,2]B[,2]的方案呢?博弈论的现代成就证明,这就是自利的个人经过重复多次的博弈的结果。这时自利的个人追求的并不是在某一次博弈中期望的得分最大,而是多次博弈中期望得分的总和为最大。1980年博弈学家罗伯特·艾克罗特用电脑计得在二人多次博弈中,对于个人来说最优方案不是“总是不合作”而是“第一次合作,以后各次依对方的对策,一报回一报”即这次你合作了,下次我回报以合作,上次你“逃跑”、不合作,我也回报以不合作。不过,从理论上讲,这里所谓“多次博弈”指的是“无限次博弈”。不过从实际上讲,无限次博弈是不可能的。只要足够地多,就会接近这个极限。在这里,个人采取这个方案,有一个摸索、学习,包括思想境界的提高的过程,一旦大家摸索到这个方针,就相当于大家在A[,2]B[,2]的决策上稳定下来。这样个人理性就转化为集体理性。“经济人”就变成了“伦理人”,伦理规范便因此而形成。为什么这样说呢?
(1)通过多次博弈,人们通过学习, 认识到必须采取基于回报的合作方针,通俗地说,这就是从合作的愿望出发,人不利我,我不利人;人若利我,我必利人。当然,人不利我,我不利人,这句话并没有利他主义的含义。但是从合作愿望出发,人若利我,我必利人,这句话就包含了互惠性的利他主义、仁爱思想的出现。没有这种互惠利他主义,个人的长远利益的实现是不可能的,社会的和平与合作是不可能的。
(2)通过多次博弈,人们的相互关系的对策在A[,2]B[,2] 区稳定下来,就意味着人们从追求自己的短期利益最大化的目标转变到追求长期利益最大化的目标,再转变到追求共同利益最大化的目标,这里包含了一个从手段转变为目标的过程。共同利益最大化本来是达到个人利益最大化的手段,现在手段变成目的。这就是功利主义和集体主义的产生。
(3)通过多次博弈,人们相互之间默契了不采取A[,2]B[,1]与A[,1]B[,2]的方案。这就意味着摒弃不正义的原则。这就是正义的原则和平等的人权的起源。
当然,以上的典型案例,说明功利原则与正义原则在同一个案例中同时被选择。博弈的案例是很多的,我们也可以设计一些案例说明理性人在这里只选择正义原则。例如在“合作狩猎”案例中,如果A[,2]B[,2]方案的支付函数值为(4.5,4.5),则这个选择只是正义原则,而不是功利原则,因为既然A[,2]B[,1]与A[,1]B[,2]的总功利10+0>4.5+4.5,即大于A[,2]B[,2]方案的总功利值。按功利原则应选择A[,1]B[,2]或A[,2]B[,1],但从上表可见它现在作为不正义的方案被摒弃了。 可见不同的伦理原则,可以通过不同的博弈而被选择。
这样从理性的、自主的自利个人的前提出发,不需要附加政府的外部作用,也不需要附加无知之幕等其他的辅助假说,只需要附加上多次不确定性博弈的条件便可以推出“伦理人”的各种伦理规范论断。伦理的社会契约是通过多次博弈而产生的。多次博弈的理论模型将功利主义、仁爱主义和正义论三者统一起来,这个集体理性和伦理规范的统一起源并不是依靠政府的外部强制(当然外部强制不是没有必要,它加速了一种客观必然性的实现),而是通过博弈过程的一系列学习和自我教育的内部过程而实现的。霍布斯问题就这样解决了。当然伦理学并不是数学的问题,博弈论伦理模型概括了现实生活中通过自组织而形成伦理规范的各种社会系统。如通过核军备竞赛而达到的核裁军形成国际核伦理规范;通过国家之间的政治、经济和军事较量而形成和平共处的国际关系;通过企业之间污染环境的博弈而形成保护环境的伦理规范,终于使功利原则、仁爱原则与环保原则四项基本原则统一起来。这些都是博弈论的关于“伦理人”形成过程的活生生案例。在改革开放中,我们常常埋怨市场经济(及其“经济人”)导致道德滑坡或道德沦丧。其实这是“经济人”通过多次博弈而转变为“伦理人”的道德爬坡过程,这是一个自发的又是自觉的过程。这个在寻求个人长期利益最大化的博弈中不断摸索、不断学习而进入伦理新境界的过程,显然包含了一种新的伦理关系临产的痛苦,我们不应该一概将这个过程出现的负面现象说成是改革开放和市场经济带来的沉重社会代价。马克思说:“一个社会即使探索到了本身运动的自然规律,它还是既不能跳过也不能用法令取消自然的发展阶段。但是它能够缩短和减轻分娩的痛苦。”
在中国古代文化中,有许多博弈论的思想。比较突出的是孙子兵法。孙子认为,在国家之间的利益冲突中,最佳的决策并不是一方将对方消灭,而是求得长治久安,要避免两败俱伤的局面。孙子说“夫用兵之法,全国为上,破国次之;全军为上,破军次之;全旅为上,破旅次之;全卒为上,破卒次之;全伍为上,破伍次之。是故百战百胜,非善之善者也。不战而屈人之兵,善之善者也”。孙子的说法可以理解为通过博弈达到和平与合作是国家采取的最佳决策。
最后,借此机会我要感谢陈晓平教授,他在《自然辩证法通讯》杂志1999年第5期上,撰文批评了我的《现代科学与伦理世界》(1999 年湖南教育出版社版)一书,特别是批评了我所主张的环保原则、功利原则、正义原则和仁爱原则不能相互还原而组成相互独立的健全社会的四项基本伦理原则这个论点,认为这是一种“整体的非本质主义”、“用不一致原则作为一个系统的公理或出发点,这个‘系统’已经不成其为系统了”。不过,陈晓平教授在他的论文中并没有指出四项基本原则之间有任何不可消解的逻辑矛盾,相反,他也同时承认这四项基本原则,只不过他认为这四项原则都可以从功利原则推出罢了。我不知道他的“不一致原则”这句话是什么意思,是指内容上的不一致呢?还是指逻辑上不相容呢?如果是后者,则我不知道四项原则“不一致”的结论从何而来,而且既然“不一致”,陈晓平教授又怎样能够从功利原则将它们统统推出?这样他的功利主义一元论岂不“也不成其为系统了”吗?我觉得他的一元功利主义伦理学在逻辑地位上并不比我的多元系统主义伦理学好多少。现在我进一步用博弈论说明了四项基本伦理原则在发生学上的统一起源,似乎有利于理解四项基本伦理原则的一致性与相容性,并有助于建立包容功利主义和道义论而由超越功利主义和道义的统一伦理理论。

【参考文献】
〔1〕周辅成编:《西方伦理学名著选辑》,商务印书馆,1996 年。
〔2〕哈贝马斯:《交往行动理论》第二卷,重庆出版社,1994 年。
〔3〕罗尔斯:《正义论》,中国社会科学出版社,1998年。
〔4〕张华夏:《现代科学与伦理世界》,湖南教育出版社, 1999年。
〔5 〕陈晓平:“伦理与科学——兼评张华夏的〈现代科学与伦理世界〉”,《自然辩证法通讯》杂志,1999年第5期。

 



哲学网编辑部 未经授权禁止复制或建立镜像
地址:上海市虹梅南路5800号2座416室 邮编:200241
ICP证号:晋ICP备 05006844号