三门问题:我到河北省来?! | 袁岚峰
大家好,我是中国科学技术大学袁岚峰。你有没有听说过“三门问题”?这是一个经典的概率论问题,我在以前的文章《贝叶斯统计:概率思维的魔法 | 袁岚峰》中介绍过,并用条件概率公式做了详细解读。
最近,我的科大师弟、香港科技大学物理系副教授王一博士也跟朋友们研究了一番三门问题。他一开始想错了,回去仔细想了一下才明白。不但是想明白了这个问题本身,而且觉得更有意义的是用这道题作例子,和大家探讨如何想清楚一个问题,而不只是找到一个巧妙的解法。于是,他在我的科普平台“风云之声”写了一篇文章《三门问题、解题思维与直觉 | 王一》。下面,我就来基于这篇文章,向大家介绍一下三门问题以及好几种思维的方法。
三门问题起源于一个电视节目,主持人叫蒙蒂·霍尔,所以这个问题也被称为蒙蒂·霍尔问题。这个节目中设置了三扇门,其中一扇门背后有奖品,另两扇门背后是空的。主持人知道哪扇门背后有奖品,但是嘉宾不知道。如果嘉宾选中了有奖品的门,最后就会中奖。
节目的步骤如下:
首先,嘉宾从三扇门中选择一扇。
然后,主持人从另外两扇门中打开一扇空的门,再问嘉宾,要不要改变自己的选择,改选剩下的那扇关着的门。
请问,现在如果你是嘉宾,你要不要改变自己的选择?
为了防止抬杠,我们先来做几点说明:
一、规则是事先定好的,不是主持人看到嘉宾选对了门,临时“忽悠”嘉宾改变选择,嘉宾也了解全套规则。
二、主持人不能选择嘉宾已选的那扇门,否则就没法问了,也不能选择有奖的那扇门,提前泄露奖品。也就是说,主持人开的一定是嘉宾没选的两扇门中一扇没有奖品的。当然,如果两扇门都没有奖品,他可以随便开一扇。
三、嘉宾可以看到主持人打开的是哪扇门,以及这扇门后面确实是空的。
四、在本来的电视节目中,“有奖”对应于奖励一辆车,“空的”对应于奖励一只山羊。不过“有奖”和“空”比“汽车”和“山羊”的价值高低更加鲜明,所以我们在这里把问题简化成“有奖”和“没奖”,减少一点对思考的干扰。
了解了题目之后,王一提出了好几种解法,从易到难分别有糊弄解法、窍门解法、暴力解法等等,最后一直讨论到思维的哲学。下面,我们就来依次介绍。
首先是糊弄解法。当你时间有限来不及思考时,你至少可以这样想:不管改变选择是不是占便宜,但它显然不吃亏(除了可能会破坏自己坚定不移的人设,不过这不在本题的讨论范围内)。所以不改白不改,就改一下选择吧。
这种解法在时间有限时,是最有效的,但它并没有帮助我们想清楚问题。如果我们问得再细致一点:如果嘉宾选择换门,获奖概率是否会增加?或者更明确地要求把获奖概率算出来,那么糊弄解法就无法蒙混过关了。这就引出了下一个层次的思维:窍门解法。
窍门解法一:概率交换。主持人开了一扇空门后,在剩下的两扇门中如果选择换门,那么它们获奖和不获奖的概率会对调。已知不换门时获奖概率是1/3,那么换门后,获奖概率就会变成2/3。所以结论是样,要换门。
窍门解法二:把门搬走。假想嘉宾选择一扇门,这扇门就是属于嘉宾的,形象地想象成把嘉宾选择的门放在嘉宾身后,另外两扇门放在主持人身后。现在假设主持人不打开自己身后任何一扇门,而是问嘉宾:你愿意用你身后的一扇门来换我身后的两扇门吗?
那么嘉宾一定愿意。因为自己身后一扇门的中奖概率是1/3,而主持人身后两扇门的中奖概率是2/3。
再仔细想想,主持人选择打开自己身后的一扇门,或者不打开,对嘉宾的获奖概率其实都没有影响。这是因为主持人身后至少有一扇空门,主持人又只能打开一扇空门,所以打开空门并没有告诉嘉宾任何额外信息。所以,在原题的情况下,嘉宾同意交换,就相当于用自己的一扇门换了主持人的两扇门,获奖概率会加倍。
好,这些就是窍门解法。窍门解法的优点是可以让人迅速解决问题,或者说“秒懂”。并且窍门解法对思维是很好的锻炼,因为窍门看多了,往往在别的问题上也能“灵机一动”,想出聪明的想法。
但是,窍门解法的迁移性比较弱。也就是说,如果你遇到另一个条件稍有改变的问题,你就又不知道怎么办了。有没有更“省心”的、普适的方法来解决问题呢?这就是下一个层次的思维:暴力解法,也就是所谓“大巧若拙”,“力大砖飞”,“大力出奇迹”。
不失一般性,假设第一扇门有奖。对于第二、第三扇门有奖的情况,我们相应轮换嘉宾和主持人的选择即可。那么,第一步,嘉宾做选择;第二步,主持人开空门;第三步,嘉宾选择换不换。对于这一系列过程,我们可以把所有的可能性都穷举在下面的图片里:
最后,看一下“结果”栏的不换和换两种选择,就很清楚了。不换门在三种情况中只有一种会中奖,即嘉宾最初选的就是有奖的门,所以不换的中奖概率是1/3。而换门在三种情况中有两种会中奖,即嘉宾最初选的是没奖的门,所以换门的中奖概率是2/3。
由此可见,解决这类问题的最普适的方式,就是暴力列举出所有可能情况。除了普适,不依赖灵机一动,暴力解法的好处还有:清晰明了;如果犯错,更明确地找到犯错的位置;以及可以放到计算机上模拟求解。
懂了暴力解法以后,我们可以说,从逻辑上,已经把三门问题及其变体,都全方位地搞清楚了。但是,从逻辑上搞清楚,就等于把问题彻底搞清楚了吗?还没有。因为,从逻辑上推导问题,和从思维上理解问题,是两回事。
看到现在,朋友们可能仍然觉得这道题是反直觉的。建议朋友们珍惜与善待反直觉的问题:因为这些问题出现的根源是,我们的直觉有问题。我们应该借助“反直觉问题”、“佯谬”等机会,改善我们的直觉。
有人可能认为直觉是无法改善的,其实并非如此。我们学习的过程,都在有意无意地改善着直觉。例如在学习驾驶汽车的时候,通过侧视镜和后视镜,直觉地感知车侧面和后面的路况,相信每位开车的朋友都经历过建立这样直觉的过程。更加抽象的数学、物理直觉也是如此。在遇到三门问题前,王一最喜欢的例子是利用相对论中的孪生子佯谬改进物理直觉。刚好关于这个问题我也做过节目,欢迎大家去了解,后面我们会再来稍微详细一点地解读孪生子佯谬。现在,三门问题也可以作为一个很好的改善数理直觉的例子。
请大家想想,在三门问题中,我们的直觉可能告诉了我们哪些错误信息?直觉是如何错的?又该如何针对这些错误,完善我们的直觉?
首先是嘉宾的视角:你因空门的开启而庆幸吗?
王一反思,自己和很多人刚看到三门问题时犯的错误在于:当主持人打开一扇空门时,以为剩下两扇门中每扇门有奖的概率变成了1/2。但其实并非如此。
这个错误直觉是哪里来的?它来自我们平常的抽奖活动。平常抽奖的时候,比如我选了三张奖券其中之一,开奖时发现第一个号码既不是我,也没有奖,那么我会感到庆幸:因为我手中奖券中奖的概率,从1/3提高到了1/2。这种情况下,我自然没有必要把手中的奖券换成剩下的另一张,因为剩下两张中奖的概率都是1/2。由于日常生活中类似这样的事情很常见,所以碰见表面上有点相似的三门问题,我们就不自觉地把它归为抽奖一类。
但是,三门问题和我们日常抽奖不同。因为主持人开门不是像抽奖一样随机选择的,他不会去开嘉宾最初选的那扇门,也不会开有奖的那扇门,只会开一扇嘉宾没有选中的空门。这是三门问题反直觉的关键。
看到这个区别,我们就应该意识到,我们不能把抽奖的直觉套用过来。我们应该做如下的思考,建立正确的直觉。
首先,我不应该因为主持人开了一扇空门而感到庆幸。因为在三门问题的设定下(主持人开的不是嘉宾的门,也不是有奖的门),无论主持人选择开哪扇门,都不会让嘉宾中奖,也不会让嘉宾离场。只要嘉宾不改变最初选择的那扇门,主持人无论开哪扇门,和嘉宾中不中奖根本没有关系。由此可见,主持人开出一扇空门后,嘉宾如果不改变选择,中奖的概率还是1/3。如果把这一点变成我们直觉的一部分,那么,前面说的第一种窍门解法“概率交换”,也就呼之欲出了:因为嘉宾选择不换的中奖概率还是1/3,那么嘉宾选择换门的中奖概率自然就是2/3。
再来看主持人的视角:打开空门,主持人泄露了信息吗?
我们直觉可能感到迷惑的第二件事情,是主持人似乎没有告诉嘉宾任何信息,但是嘉宾却得到了信息。得到信息的表现,就是改变选择会增大中奖概率。那么,嘉宾得到的信息是哪里来的呢?
直觉上,如果主持人泄露了信息,那么嘉宾改变选择,是再自然不过的事情。比如说嘉宾最初选择一扇门后,主持人直截了当地告诉嘉宾,你选错了!或者告诉他,你选择另一扇门的中奖概率更高!那么,嘉宾自然会改变选择。
所以,我们直觉与逻辑的症结在于:主持人打开一扇空门,如何泄露了中奖信息?
其实应该这么想,如果主持人打开空门时,同时对嘉宾说:“选择打开这扇空门时,我回避了你选的那扇门,也没有打开有奖的门,所以你那扇门得奖概率不变。但是我帮你排除了另一扇空门,所以剩下这扇门概率提高了。你要不要改变你的选择呢?”这样,主持人泄露的信息是不是就一目了然了?只不过实际上,主持人并没有说话,他的劝说是隐含在行为逻辑里的,你只是需要把主持人泄露的信息“脑补”出来而已。
这样,我们的直觉就又多了一条:不必直接告诉答案,也可以用概率论的方式传递信息。
理解到这里,想必在你心中三门问题已经从反直觉变成符合直觉了。然后,我们还可以“从三到万”,通过极限情况来加强直觉:假定有一万扇门,嘉宾本来中奖的概率只有1/10000,而主持人帮助嘉宾排除了9998个错误答案之后,嘉宾改变选择后的中奖概率就上升为9999/10000了。这个例子非常容易理解吧?用极小和极大的数字来强化直觉,除了强化理解之外,如果哪里仍然反直觉,也有助于我们找出这个问题。
再下一步,王一查阅了网上一些对三门问题的解释,发现是五花八门。有些作者会引入一些更深入的概念,例如概率的频率解释和贝叶斯解释之争,主观概率,博弈论,甚至……量子力学?!
例如有这么一篇神奇的文章《论三门问题对双缝干涉实验的启示》,发在《辽宁师专学报(自然科学版)》。更神奇的是它的作者单位:河北省沽源监狱,七监区。——我到河北省来!
当然,了解这些更深入的概念是有好处的。不过把这些概念与三门问题混杂起来,对理解三门问题本身恐怕并没有益处,而是用一个难理解的概念,人为增加了理解另一个问题的难度。
如果我们把科学哲学中的奥卡姆剃刀(即“如无必要,勿增实体”)稍加修改,作为一个把问题解释清楚的建议,那就是:“如无必要,勿增高端概念”。
最后,我们思考一个非常上层次的问题:想问题,想到什么程度算清楚了?
以三门问题这样一道反直觉的智力题为例,我们看到,我们可以有糊弄、窍门、暴力和培养直觉等多种解法。糊弄最快,培养直觉最慢,每种解法都有自己的优缺点。
科学中,这样值得从多种角度来思考的问题很多。比如前面提到的孪生子佯谬:一对年龄相同的双胞胎,一个在地球上,一个坐接近光速的飞船,离开地球多年再返回,那么双胞胎再相遇时,谁的年龄大,谁的年龄小?
解决这个问题需要狭义相对论的知识,特别是在静止的观测者看来,“运动时钟变慢”的效应。
对此,我们可以用糊弄法,说地球上的人更像静止的,而飞船上的人时钟变慢,所以他更年轻。
我们也可以用窍门思维:飞船从出发到返回,必然经历加速。所以不能在飞船参照系中直接应用狭义相对论的结论,所以需要相信地球上的观测者。其实这正是我在以前的节目中举的《费曼物理学讲义》中的方法,结论是感受到加速度的那位即飞船上的那位会比较年轻(孪生子佯谬能驳倒相对论吗?| 科技袁人)。
我们也可以用暴力求解:写出坐标,套用洛伦兹变换公式,就可以算出来。
我们也可以用直觉的思考,或者想象双生子每时每刻都在通讯,随时看彼此变老的速度,或者用等效原理把钟慢效应等效成引力。
这些方法都能带来同一个结论。抓住一个反直觉问题,应该尽可能多地改善我们的直觉,最好不要满足于一个方法。
更广而言之,为什么需要找到一道题的多种解法呢?或许更重要的一点是,无论科研中还是人生中的问题,我们都没法像习题一样,做完以后就可以对照标准答案。很多难题需要我们自己探索答案。而在探索的过程中,人难免犯错,沿着一条思路得到的结论不一定正确。只有沿着每个可能的方向都想清楚了,算清楚了,我们才真正搞清楚了这个问题。