考上清华和中500万,哪个更难?

来源:微信公号“李永乐老师”

有人说他一生有两大理想:考上清华大学,中500万大奖。对大多数人来说,这两件事都不容易。但是大家有没有想过这两件事哪件更难呢?

我们不妨首先从概率论角度来讨论一下这个问题。

概率论

首先说中500万。如果我们只是买一注双色球,那么在33个红球中选择6个,在16个蓝色球中选一个,利用组合数可以计算出一共有大约1772万种可能。中大奖只有一组号码,因此中奖的概率为1/1772万。实在是太难了。

那么考清华呢?

500

清华大学每年招生大约3000人,以2017年为例,全国考生842万。如果所有考生都报名清华大学,清华大学采取抽签方式决定录取,则录取概率是3000/942万=3/万.

也就是说,每一万名考生中只有3名同学能够被录取,真是万里挑一。

然而,这个概率还是远远超过双色球中500万的概率,考上清华大约是中500万大奖概率的5000倍!也就是说:考上清华比中五百万大奖要容易5000倍。

有人说:你算错了,因为高考是分省录取的,有的省考生多,名额少,所以会更难。

我们不妨来看看河南省。2017年河南省考生83万,清华大学录取100人,录取率100/83万=1.2/万。每1万名考生录取1.2人。这虽然比全国平均录取率低了不少,但是仍然是中500万大奖概率的2000倍。

所以说:清华的学生长什么样见过,中五百万的人从来没见过长啥样。

500

以上的模型非常粗糙,因为清华大学并不是抽签决定录取的,而是要看考试成绩。于是有同学会说,我从小学习就不好,就算把3000个名额都投到我们省我也考不上啊。统计学告诉你,其实不一定。

正态分布

在统计学上有一个著名的实验:高尔顿钉板实验。

英国生物统计学家高尔顿提出了高尔顿钉板实验。在一个漏斗中装有一些小球,漏斗下方有一些水平钉子,小球碰到钉子就会随机反弹。经过一次次碰撞,小球最终掉落到下方的竖直槽中。

500

如果只下落一个小球,那么小球掉落在哪个槽中是随机的。但是如果一次次让小球下落,或者一次性释放许多小球,就会发现中央的小球多,两侧的小球少。球的数量满足一种规律。

不仅仅是高尔顿钉板,人们发现只要一个结果是由许多随即量影响的,那么这个结果就会满足这种“中间多,两头少”的规律。例如一个年龄段某地区男性的身高就近似满足正态分布。

500

被誉为数学王子的德国数学家高斯对正态分布理论有重大贡献,因此人们也把正态分布称为高斯分布。以前的德国十马克货币上就印有高斯和他的正态分布曲线。

500

我们来介绍一下正态分布曲线。

正态分布的横坐标表示取值,例如人的身高,可能是3250px-5000px之间,把这些数据每隔一小段作为一个值画作横坐标。纵坐标表示概率密度,即在一个很小的身高范围内人数占总人数的比例。在这种规定下,曲线下方的面积就表示一个范围内身高人数占总人数的比例。显而易见,整条曲线下方的面积为1。

在这条曲线上,最高的部位刚好在曲线中间,称为期望μ。而曲线的宽窄用标准差σ表示。σ越大,则线条越矮胖;σ越小,则线条越瘦高。

500

人们经过计算得出了结论:满足正态分布的随机量,最后取值在μ-σ到μ+σ之间的概率大约是68.2%,在μ-2σ到μ+2σ之间的概率大约是95%等。

500

一个人的考试成绩也受到多种因素的影响。比如自己学习成绩高低、考试那天的身体状态、题目的难易程度,甚至是考场上的风吹草动。所以考试成绩并不是一定的,而会有波动和起伏。学习好的同学期望μ比较高,成绩稳定的同学σ比较小。虽然我们不知道自己最终成绩如何,但是可以通过正态分布假设计算出自己成绩在各个区间的概率,从而推测自己是不是能考上清华。

举个例子

例如:小明同学在高三参加了四次模拟考试,成绩分别是580,600,680和620。而清华的分数线为690分,这名同学是不是一定考不上清华呢?

我们假设这位同学的成绩满足正态分布,根据数据计算出他的平均分和标准差。

平均分公式:

500

标准差公式:

500

所以,清华的分数线比这位同学的平均分高了Δx=690-620=70=1.87σ

画出正态分布曲线,在μ+1.87σ右侧部分的面积就是他考上清华的概率。这个概率可以通过查表获得。

500

这个表表示x的取值小于某值时出现的概率。例如第三列第四行0.5832表示x<μ+0.21σ的概率。

利用这个表格我们可以查询到x<μ+1.87σ的概率为0.9693,因此小明考上清华的概率(x>μ+1.87σ)为1-0.9693=0.0307,大约为3%。

即便一个同学每次考试都在600分以下,他依然有一定概率在高考中考到690分清华的分数线,只不过可能是万分之几量级。

高考在即,李老师祝大家考试顺利,都能够考出μ+2σ以上的成绩,考上自己理想的大学。

最近更新的专栏

全部专栏