择婿之难(20250224)
昨天看到一个有趣的问题,题目内容为:“请帮我仔细算一下,中国的男性中,21~28岁适婚年龄,身高175厘米以上,体重65~75公斤,月收入8000元以上,学历本科及以上,情绪稳定,有责任心,三观正,孝敬父母,且长相帅气,性格幽默,不抽烟不喝酒酌男生,有多少个。”
我大致估算了一下,人数大概在6000人左右,即大概率为3000~10000人。
以前发过帖子谈及此类问题。其估算过程有个专门的名称:费米估计。费米估计的最有趣之处在于,即便计算过程中使用的全是不精确的估计值,但最终结果却惊人的准确,很少会差上一个数量级。
在进行费米估计时,需要注意以下两点:
(1)如果要保证最后的估计结果更准确,在进行概率乘法运算时,需要保证这些概率事件是相互完全独立的,否则就需要计算条件概率。
(2)不仅如此,还要求这些概率事件的概率分布具有遍历性。粗略地说,所谓的遍历性是指一群人在同一时间的统计特性(尤其是期望)和一个人在其全部时间的统计特性一致,即集合概率在时间和空间上的分布是等价的。
我的计算过程为:
(1)年龄条件。大致估计目前年龄在21~28岁区间的全国人数为1亿人。男女各半,男性人数因而为5000万。
(2)身高条件。目前孩子的身高都较高,未看到去年的准确数据,但大致估计在此区间段的男性平均身高约为173厘米。换言之,身高超过175厘米的人数大致为40%。如此,满足条件的男性人数缩减为2000万。
(3)体重条件。这是本题的第一个陷阱。显然,身高和体重并非是完全独立的两个概率事件。就提问者的想法而言,她其实是在要求男方的体重位于正常区间,而非严格限制在该体重区间之内。原因显而易见,如果一名男性的身高为200厘米,要求其体重位于75公斤以下,那其实就是偏瘦了。此处简单假设超重至接近肥胖的人数比例约为20%,则满足条件的男性人数缩减为1600万。
(4)学历与收入估计。这是本题的第二个陷阱。正常情况下,较高的学历往往对应较高的薪资水平,因而这同样为两个非完全独立的概率事件。此处简单假设本科或以上的学历人数比例为30%,则满足条件的男性人数缩减为480万。加上零头,以500万计。再考虑条件概率,简单假设其中月薪在8000元以上的人数为80%,则满足条件的男性人数缩减为400万。
(5)情绪稳定、有责任心、三观正、孝敬父母等条件:此类条件很难量化,尤其是在没有遇到真正需要这些素质的情况下。简单假设满足此类条件的人数占比为90%,即360万。同样抹去零头,则满足条件的男性人数保持为400万。
(6)长相帅气条件:简单估计为占比10%,则满足条件的男性人数缩减为40万。
(7)性格幽默条件:此条件实际上相当难得,这要求男方需要从与众不同的角度思考问题。此处仍简单估计为占比10%,则满足条件的男性人数缩减为4万。
(8)不抽烟不喝酒条件:估计占比为15%(大部分人可能不抽烟,但可能会喝点酒),则满足条件的男性人数缩减为6000。
(9)全国总人口简单以14亿计算,则满足上述条件的男性人口占比约为0.00043%。
(10)假设提问者居住在北京或上海这样的大城市,人口均以简单2500万计算(北京较少)。那么在满足遍历性条件时,在这样的人口基数下,符合条件的男性大致为107人。
(11)如果该提问者每日可以遇到100人,那么在连续3650日内将遇到36.5万人。在这些人中,与至少一位满足条件的男性擦肩而过的概率约为79%——虽然每次遇到满足条件的男性的概率只有0.00043%,但连续36.5万次未遇到一位满足条件的男性的概率则只有21%。
(12)有研究表明——抱歉,忘记该篇论文的名字和出处了——一个人大概在相亲6000次后才能找到最契合的伴侣。所以,如果不致力于提升自己与人相处的能力,择佳婿这种事,本质上完全依赖运气。
得到结果后询问深度求索,其答案为100人左右。注意:深度求索使用的方法同样为费米估计,但犯了前文指出的错误。
附深度求索的答案如下(其思考过程过长,此处仅列出思考过程首页):