四年前翻车的大选民调,还值得信任吗?

  摘要:大选民调对哪位总统候选人入主白宫有很大的参考价值,但2016年大选,被多数民调机构认为势在必得的希拉里败北,使不少人对民调的准确性持怀疑态度。现距2020年大选结束不足两个月,民调数据显示拜登有着不小的优势,但2016年民调“翻车”历历在目,受创者疑虑旧事重演,有人对民调数据半信半疑,有人甚至认为民调结果不可信,须与之背道而驰。要破除盲目的怀疑需要对四年前的预测失败做一个回顾。本文将通过阐释何为大选民调的准确性来为民调的“翻车”翻案,回顾2016年大选民调失败的原因,并探究导致失败的这些错误是否可以被纠正。本文最后将探讨2020大选各类机构的民调是否就这些错误做了修正,以及当前民调还存在着哪些问题。

  关键词:大选民调 、2016大选、 2020大选

500

  2016年大选结果分晓前,民调给人们的印象是:入主白宫,希拉里胜券在握。因此,当11月9日特朗普当选的消息一出,民调行业首当其冲,被认为“失败了”,“不准确”且不可信。四年后,美国又一次大选,不少人对大选民调保持了谨慎乃至怀疑的态度。那么,从民调的发展历史看,其预测结果变得越来越不准确了吗?2016大选民调是不准确的吗?当下的大选民调还值得相信吗?

  民调的准确性是指什么?

  民调是对某地某时的群体意见进行判断的截面图,它是群众在主要事务上意见和取向的直观反映。从民调发展的历史来看,民调的方法越来越严谨,其预测结果总体来说也越来越准确。民调兴起于19世纪的美国,一开始即被用来预测总统大选。1827年,宾夕法尼亚州的《哈里斯堡宾州人报》成功预测了安德鲁·杰克逊的当选,民调开始流行。当时,多为新闻媒体开展民调活动,受访者大多是这些媒体的读者或随机访问的路人,样本挑选不够随机,代表性亦不足。1936年,新型民调机构盖洛普(Gallup)广泛收集数据,根据人口分布特点设计抽样方案,成功预测了富兰克林·罗斯福的压倒性胜利,而坚持老办法的《文学文摘》(Literary Digest)则一败涂地。此后,大多数的民调机构在样本选择、数据分析等方面,均采用新型统计方法。由此可以看出,民调的方法经历了一个由粗糙到严谨的发展过程。

  除了方法的改进,美国还存在着促进民调发展的机构。1948年大选,民调预测托马斯·杜威处于优势地位,但结果却是哈里·杜鲁门成功当选。这一失败引起了民调行业对其未来发展的担忧,即后促成了美国民意研究协会(American Association for Public Opinion Research, AAPOR)的成立。此协会现由2000多名公共舆论、民意调查等方面的机构或业内人士组成,强调民意研究对民主政体的良性发展至关重要,规定所有成员须遵守的民调道德与标准,创办了《民意季刊》(Public Opinion Quarterly)等重要刊物,对民意调查的发展起到了促进作用。2016年,在普遍认为民调预测失败的情况下,美国民意研究协会联合其成员对这一“失败”做了分析与反思。

  自1936年以盖洛普为代表的新型民调机构出现后,全国性大选民调预测结果的绝对误差基本呈下降趋势(图1),也就是说其准确性呈上升趋势。不过,民调的准确性是什么,民众和专业从事民调者有不同的看法。复旦大学的王中原认为,“媒体和大众更关心谁胜谁负,学术研究则更加追求预测精度”。学术研究上的预测精度则是指,预测结果与实际结果之间的差距大小。假设在一场大选中,候选人A在民调中领先8%,最终的实际支持率领先1%,则民调成功预测胜负,预测结果和实际结果之间相差7%;在另一场大选中,候选人A在民调中领先2%,但最终的实际支持率落后3%,则民调未能成功预测胜负,预测结果和实际结果之间相差5%。尽管从胜负上看,假设中的前者成功了,但在预测精度上后者更高。实际上,著名民调机构538(FiveThirtyEight)主编奈特·希尔沃(Nate Silver)亦认为,民调结果的准确性不是根据预测结果与实际胜负是否一致为准绳,而应该以测量结果与实际结果之间的差距大小为判断。民调若盲目地追求胜负,而不顾准确度,则预测的成功率将有很大的波动性,其本身也无法解释影响选民的复杂因素,更无法对大选后的种种情况做准确的分析。

500

  图1 大选倒计时21天民调的误差,1972-2016 来源:538网站

  受限于技术手段、难以预测的投票率和大选中不确定性事件的出现,大选民调无法做到与实际结果完全一致。尽管无法做到绝对一致,全国大选民调的准确度还是在不断提高。图1显示,2016年全国大选民调的准确率要高于2012年,低于误差平均值。2016年,在普选票上,希拉里的得票率为48.18%,特朗普的得票率为46.09%,落后希拉里2.09%,这与全国大选民调预测的希拉里领先3%相差甚小,即准确度相当高。那为何四年前的大选民调留下了失败、不能信任的印象呢?

  2016年大选民调翻车了吗?

  2016年大选结束后,媒体和公众普遍认为大选民调丧失了准确性。造成此种印象有两个主要原因:一是多数媒体对希拉里获胜有膨胀的信心,报道有失偏颇;二是预测与最终结果不一致。

  首先,媒体对希拉里胜出几乎无悬念进行大肆渲染,挑选有利的数据佐证观点,而当特朗普胜出后,又指责大选民调误导群众。在2016年总统竞选过程中,民调显示有此次大选变量较多,有高度不确定性。但媒体认为希拉里睿智的竞选政策、特朗普的种族主义都使得希拉里在选举人团层面有更为明显的优势,甚至认为科米重启邮件门的调查也无法改变这一领先地位,忽视了大批摇摆选民(undecided voters),即大批犹豫不决、不知道要投给谁的选民。多数媒体把民调中希拉里的优势解读为其将入主白宫。在选前一周,民调显示希拉里也仅稍稍领先,却仍被媒体报道为获胜几率十分大。大选结束后,媒体声称大选民调预测失败,在将来也不能再予以信任。媒体作为信息的承载和传播者,影响着群众对具体事务的看法,但其本身存在的诸如缺乏严谨分析、抗拒不确定性以及惰于自我纠正等弱点,导致其对大选民调的报道中存在误读误传的情况。此外,有研究表明,媒体过度的渲染可能导致希拉里支持者信心高涨,但投票热情减弱。

  其次,民调预测希拉里当选几率更大,但最终特朗普当选,更关心谁胜谁负的媒体和大众便直观地认为预测失败了。普选得票率更高的希拉里未能胜选,特朗普成了“少数票总统”,这是由美国独特的选举人团制度(the electoral college)造成的。在美国历史上,现仅有五位少数票总统,一般来说,在普选中获胜的总统也将获得更多的选举人票。选举人团由538名选举人组成,每州的选举人数量等于其参众两院议员的总数,哥伦比亚特区的选举人数量同人口最少的州一致。赢得一半以上的选举人票数,即赢得选举。这一制度一定程度上保障了人口较少州的权利,维护了联邦制的稳定,但除缅因州与内布拉斯加州外,美国各州施行赢者通吃(winner-take-all)的规则,故此公民因居住地不同而拥有不同价值的选票。正是由于这一制度,极小的难以预测的选票优势或弱势即可能会导致大选结局的不同。在2016年美国大选中,三个倒戈的蓝州都被共和党以极弱的优势获取。特朗普以0.23%、10704张选票在密歇根州领先,以0.73%、44292张选票拿下宾夕法尼亚州,在威斯康辛州又以0.77%、22748张选票赢得威斯康星州,最终凭借不到8万的选票拿下了此三州全部共46张选举人票,翻转了不利局势,击败了普选票领先287万的希拉里。这三州的最终选票差距都在1%以内,十分细微,均处于民调的合理误差范围内。但正是这难以预测的细微的误差起到了关键作用,使最终取得232张选举人票的希拉里失利。

  2016年大选全国民调总体是准确的,也高于民调预测的历史平均水平。人们对民调做出预测失败的判断,一方面是由于媒体的渲染,另一方面是因为预测当选者与实际胜出者不一致。无论是媒体的推波助澜,还是由于特殊选举制度带来的大选反转和无法侦察出的极小的最终选票差距,都不是民调本身的问题。但这并非是说2016年大选民调不存在问题。

  2016年大选民调表现不佳,州级民调需负很大责任。全国大选民调仅是对当下全美选民观点和态度的反映,而在实行选举人团制度的美国,州级民调的参考价值更大。不过,由于资金不足,自身党派倾向以及调查方法相对单一等问题,州级民调的准确率常常要低于全国民调。图1显示,自1972年起,州级民调的误差平均值比全国民调高0.7,但2016年州级民调的误差平均值更高,比平均误差值高0.4,比当年全国大选民调则高出2.1。

  一般认为,2016年民调的主要问题是低估了教育程度不高的白人对特朗普的支持率,这一问题在州级民调中尤为明显。美国民意研究协会的一份报告显示,诸多研究表明低学历或无大学学历的选民不愿参与民调,在多届大选民调中代表性不足,而高学历选民则相反,其样本比例常常过大。2016年,此种情况再次发生,对民调的准确性造成了实质性的打击。那么,往届大选中这种情况为什么没有打击当时的民调呢?这一问题的答案在于,在此前的大选中,高中及以下学历的选民与研究生学历的选民基本投给同一候选人,所以一端代表性不足和另一端样本比例过多相互抵消,未能根本上影响大选民调的准确性。但在2016年,高中及以下的低学历选民与高学历选民之间产生候选人分歧,抵消效应不再产生,由此产生的准确性也不复存在了。

  前文提到,2016年全国大选民调的准确性是高于历史平均水平的,且高于2012年大选民调的准确率,那么受教育程度这一因素为何没有对2016年全国大选民调的准确性产生不利影响呢?奈特·希尔沃(Nate Silver)认为, 民调低估了低学历白人对特朗普的支持,但也低估了非白人或高学历选民对希拉里的支持,二者相互抵消,故全国大选民调的准确性未因低学历和高学历选民的分歧而受影响。不过,美国民意研究协会的报告称,2016年全国大选民调准确性高是因为全国大选民调机及时构调整了不同学历选民的比例。

  不管出于何种原因,全国大选民调的结果是相对准确的,不准确的是州级民调。2016年州级民调未能重视学历对大选的影响,低学历的选民代表性不足既无法同州内的高学历过度代表抵消,也因局限于一州之内,而无法产生类似全国大选民调那样的抵消效应。在起到关键作用的三个倒戈的蓝州中,州级民调正是由于对教育因素的重视不足,低估了特朗普的支持率。在大选结束两周前,威斯康星州民调显示,希拉里领先特朗普2-12个百分点,但最终后者拿下了该州;宾夕法尼亚州民调则对其支持率低估了4-5个百分点;密歇根州民调则平均低估了3.5个百分点。出口民调(exit poll)表明,在此三州,无大学学历的白人群体对特朗普的支持起到了翻转选情的关键作用。州级民调中对低学历白人选民代表性不足的惯例、选前对特朗普的低估、低学历白人对大选选情的逆转作用,都指明2016年州级民调中低学历代表性不足造成了其预测不准确。

500

  影响2016年大选民调预测“失败”的重要因素还有以下两个。第一,摇摆选民。2016年,无论是特朗普还是希拉里,都未受到热切的支持。许多选民在九月份、十月份的民调中表示他们不知道要投票给谁,或者考虑投给其他党派,这一现象在中西部的战场州尤为显著。在密歇根、威斯康星、宾夕法尼亚三州,11%至15%的选民在选前最后一周才决定手中选票的归属,而出口民调显示这些州的摇摆选民大多投给了特朗普。第二,“支持特朗普羞耻现象”(shy Trump effect), 即民调受访者羞于表露自己是特朗普支持者。2016年,由于特朗普种族歧视等出格言论,其部分支持者在接受民调时,不愿表明自己将会把选票投给特朗普。2016年,比起面对面采访选民,民调机构通过电话采访得到的特朗普支持率要高2%至3%。选后民调显示,35%的特朗普支持者表示曾不愿对外透露谁是自己支持的候选人。无论是州级民调对低学历选民的忽视,还是摇摆选民与shy Trump effect,都对2016年大选民调的准确性产生了不利影响。那么四年过去,这些问题改善了吗?

  2020大选民调的进与退

  前文已经指出,2016年的全国大选民调并未翻车,与此前的民调相比亦相当准确,民主党在三个关键的战场州也只是以极小的最终选票差距失利。无论从民调准确性不断提高的趋势来看,还是考虑到2020年大选民调在一些问题上已有所进步,2020年全国大选民调都值得信任。不过,这并非是说2020大选民调十分完美,不存在问题和不确定性。

  首先,受教育程度仍然在不同学历层次的白人选民中发挥重要作用,影响着其投票取向。皮尤研究中心(Pew Research Center)2020年8月份的报告显示,特朗普在低学历和高学历白人中的支持率分别为64%和38%,拜登在这两类白人中的支持率为34%和61%。这表明低学历和高学历白人的候选人分歧仍然存在,抵消效应无法产生。2016年大选结束后,不少民调机构进行了自我反思。美国民意研究协会发表了长篇文章分析民调预测的“失败”,指出全国大选民调考虑到了不同学历白人对预测结果的影响,问题在于多数州级民调忽视选民受教育程度对选票产生影响。庆幸的是,州级民调在这一问题上有所改善。《纽约时报》(The New York Times)五月的一篇报道称,2016年,仅约20%的战场州州级民调适当调整不同学历白人在样本中的比例,而这一比例在2020年五月份已接近50%。

  其次,摇摆选民的比例比四年前大大下降。2016年,不少选民犹豫不决,不知将票投给谁或打算投给其他的党派。但最终这些选民,尤其是战场州的白人蓝领,大多数投给了特朗普。《新闻周刊》(Newsweek)的一篇报道称,2016年8月份,约有20%的选民徘徊不定,现在这一比例为10%。

  但2020大选民调也有问题。首先,shy Trump的现象仍然存在。2020年大选民调中,拜登的支持率持续领先特朗普。对此,特朗普的支持者和民调怀疑者认为,2016年羞于公开支持特朗普情况的再现可能导致了特朗普落后的支持率。尽管美国民意研究协会的报告曾表示,没有足够的证据可证明shy Trump现象,但在美国政治极化的氛围下,自由充分的政治意见表达确实遇到了阻碍。卡托研究所(Cato Institute)七月份的研究表明,77%的保守派、53%的自由派以及64%的温和派认为如今无法自如地分享政见了。这将给民调了解真实的民意带来困难。

  其次,尽管摇摆选民比例下降不少,但2020大选民调显示,多数拜登的支持者是为了反对特朗普,也就是说,其根基并不稳固。当同等不利的不确定事件发生时,他的支持率恐将受到更大的波动。此外,虽然不少州级民调开始重视教育这一变量,但由于资金不足、民调不严谨、民调机构之间不协调,州级民调的准确性仍无法和全国大选民调相比。这使得全国大选民调即使准确地预测出普选票领先者,也因州级民调而无法对这一领先者是否能获得多数的选举人票做相对准确、有把握的预判。

  总的来说,2016年的全国大选民调是准确的,出差错的是州级民调。四年之后,2016年大选民调出现的问题得到了一定的纠正,但也有一些问题遗留至今。从民调的发展历史来看,其准确性在不断提高,全国大选民调更是如此。全国性的民调组织亦在不断促进民调机构进行反思与改进。因此,2020年的全国大选民调仍值得相信,但需要对表现不佳的州级民调保持警惕。可以看到,文中提到的三个关键的摇摆州,其州级民调的表现均不佳,一定程度上放大了希拉里当选的信号,误导了民众。四年后,州级民调虽有一定改进,但因资金不足民调机构之间不协调等问题,其准确性仍不能和全国大选民调相比。

全部专栏