美国爆发40年来最致命流感?三招教你甄别信息的真伪

来源 | 顾而言之

美国爆发40年来最致命流感?

三招教你甄别信息的真伪

提升决策的正确性

昨天看到一篇标题很吓人的文章,说美国爆发了40年来最致命流感,6600人死亡。而且27年来首次再现乙型流感病毒。

一开始我想没多想,但后来觉得不对劲,于是跑到外网查了一下,发现这个信息里面其实有好几个容易误导人的地方,在此一一披露。

顺便也聊聊,我们会被信息误导的常见盲区。

下面这篇是我昨天看到的文章,说美国爆发了40年来最致命流感,6600人死亡。而且27年来首次再现致命性乙型流感病毒。

500

要查一下美国到底发生了什么,最简单的就是跑去谷歌上搜索。

简单搜索一下几个关键词,bad flu America(美国流感)就会看到与其相关的所有新闻。

500

最先出现一篇是纽约时报的,说的大致意思是,这次的流感季可能会很糟糕。在下方的文章概要里可以看到一些比较惊人的数字:比如说,46个州都有流感的迹象,6.1万美国人死于流感。

再往后翻会发现有一些标题和我看到的中文标题有类似的内容。

500

比如说,一个叫The Hill的媒体说2020年可能是最糟糕的美国流感季。也许这就是中文媒体标题的一部分来源。但是你仔细去读,这篇文章其实说的是2020年可能会像2017~2028那个流感季一样糟糕。

也就是说今年并不是最糟糕的,而是最糟糕的之一。那么我们已经破除了一个信息上的误区。

再往后翻,搜索的结果中就没有什么流感相关新闻了,甚至已经跳到了跟中国相关的新闻了。

也就是说这个流感季的新闻,在美国媒体界看来,不是什么惊天动地的事,不然的话可能会有好几页的搜索结果都跟它相关。

其实,如果你在美国呆过几年,你就会知道,每年秋冬季节都是美国的流感季。所以的确有可能,流感的流行在美国并不是什么大事。

今年美国的流感到底有多糟糕呢?

我们先点进纽约时报的报道去看一下。因为要具体了解一件事情,不能只看标题。

在文章里,你会发现最早我们在文章概要里看到的6.1万美国人因流感致死的数字,其实指的是2017~2018那个流感季节中的人数。

所以并不是今年有6.1万人死亡,但是如果只看文章概要,就可能容易得出这种结论。 

另外,只看一家数据是不够的。如果要验证一个消息的真伪,就需要看不同的来源做数据的对比。

我看了好几个新闻,发现它们引用的都是美国一个叫做CDC的机构的数据。而且数据都差不多,都是说有差不多2900人死于这一个流感季。另外预测可能有1300多万人得了流感。

500

CDC全称叫做美国疾病防治和控制中心,它每年都会发布关于流感季的数据。

如果要接着寻求数据的真实性,就要找到它最早的来源。于是我就跑去了CDC的网站。把相关的东西全看了几遍。

里面有一些比较关键的数据,可能也是各媒体援引的最早来源,就是以下面这张图表。

500

它上面写了从2019年10月到2020年11月11号,可能会有1300万到1800万人患了流感,然后其中可能会有6000多人因为流感而死亡。

听起来好像各个媒体报道的并不假,但是里面有一个核心词,Estimates(预测)。

预测,什么意思?CDC也写了,预测就是说它其实是通过对于美国3亿人口里8.5%的人口进行抽样调查,然后再通过一个数学模型计算得到的这个数字。(原文如下)

500

也就是说如果CDC调查的样本所取的地方是流感的高发地区,那么这个预测就有可能是过高估计了。我没有看到它的样本具体来源,不过通常应该是会去高发地区和低发地区做更平均的取样。

因为是预测,所以CDC上所有的数据都是个范围。比如说,死亡数从6600人到17,000人都有可能。而不是单一的6600人,像媒体报道那样。 

那么17,000人是什么概念呢?

因为之前有美国的新闻报道上说17年到18年的流感季是最糟糕的,所以我们就来看一下这一年的数据。CDC有一个非常完整的表格,列出了每年预测的数据。

500

500

过去十年里,CDC预测美国死于流感的人的数据中,最低预测是1.2万人,在95%置信区间。

数值为95%置信区间意味着如果在同样情况下重复样本分析(这回生成不同的数据集),95%的区间会得出符合(总体)情况的实际结果。这并不意味着真实数值的概率也在95%置信区间之内。

最高的一年是2017~2018年,预测有6.1万人死于流感,去年则预测会有3.4万人死于流感,因此到目前为止,假定预测6600人死于流感是比较准确的,对比历史上来说的话,也不算多。

还有什么是我们可能错过的呢?

在新闻里还提到:这是美国27年以来首次在线致命的乙型流感。我们照例用刚刚的步骤来验证一下。

乙型流感的英文是influenza b。在网上搜索相关新闻,发现其实在好几年前也已经有。所以这并不是27年来首次出现了乙型流感。

那么这个标题到底是哪里来的呢?我们需要更细致的搜索。于是,我用了短语:influenza b back in 27 years ( 27年后乙型流感再度流行)。结果就有下面的新闻。

500

你会发现一篇关于艾荷华州出现27年未见的乙型流感的文章。(如下)

500

具体读下去,你会发现27年是指乙型流感没有成为predominant 流感病毒的时间。predominant 的意思是占大多数的,主导型的。

所以并不是说27年内美国都没有乙型流感,而只是27年内美国的乙型流感并不是它最重要的流感的来源。

查到这里,我们已经发现了最早看到的报道里好几个信息的误区。尤其它的标题,容易误导人们把预测当做事实。因此我们在对待这条信息上应该采取什么样的态度也就一目了然了。

所以,当你看到一些出乎意料的信息,你需要做的并不是盲目的去相信它,而是采用各种方式去验证它。

毕竟很多时候,决策的错误并不是源于这个人本身决策机制和决策能力上的问题,而是源于他在信息收集上的麻痹大意。

人们对于信息收集上的认知有通常有三个来源:

1. 通过自己亲身经历得来。 

但是这部分的信息可能因为受到人观察力以及记忆力的影响而失真。其实,有各类科学研究表明人的记忆是相当不靠谱的,我以后会另外起一篇文章再做讨论。

2. 通过第三方转述得来。 

第三方可能会犯各种错误, 比如关于美国流感,一些媒体转述的新闻里就有我们刚刚分析到的几个问题:没有注意到最早的来源CDC里面用的是预测而把预测当做了事实;断章取义,比如说在最初描写美国可能遇到40年最糟糕的流感的文章里都有说明这个流感有可能会赶上17年-18年那么糟糕,但是媒体断章取义的舍掉了后面的补充,那就会让人认为这是美国40年来最糟糕的流感。

3. 通过自己研究和发现获取信息。 

这里面也会有很多盲区。比如,在对一个话题不熟悉的情况下,一个人容易漏掉一些重要的背景资料。如果我们刚刚没有去看历史数据发现美国过去10年每年平均都有关于数千万人感染上流感,几万人死于流感的预测, 那么我们单独去看6600人死于流感这条信息,感知就会大不一样。

总结一下, 快速对信息进行验证有三个步骤:

1. 搜索各类相关关键词

2. 对比不同来源的信息内容和数据

3. 追溯到最早的来源,防止信息被取章断意或者遗漏,或者错写。

只有对于重要的消息进行验证,才能更好确保我们在决策上的正确性。这其实是自我认知三大块里面很重要的一个部分 -- 对自己获取外界信息方式的认知。当我们具备这样的认知,仔细看待类似美国流感这样的信息时,一方面可以避免过度恐慌,但同时也提醒自己不要麻痹大意。毕竟这里面的每一个数字都是一个个鲜活的生命。

最后,想补充一下,这篇文章里面以比较理性的方式来看待这些数据。可是,每一个数字的背后都可能是一个很令人惋惜的故事。我没有丝毫不尊重相关人员的意思,只是想纯粹的从信息辨别真伪的角度来看待一下这个事情。

 希望所有人都能平安度过目前的时期。

500

(完)

全部专栏