无论是根据美国选情网站270toWin、RealClearPolitics等的大选地图、《纽.约.时.报》按照民调的各州分类,还是《经济学人》企图预测大选胜负或然率的复杂模型,拜登都呈现出几乎“躺赢”的形势。
然而,有过2016年民调与模型都指向希拉里大胜,而特朗普却“黑马跑出”的惨痛教训,美国选民对民调似乎是“一笑置之”,心中仍有对“特朗普奇迹”再次出现的预期。根据过去数月的民调,虽然拜登民望稳定领先特朗普,可是较多选民依然认为特朗普会再次证明民调为错,反胜拜登。
首先,由于没有任何民调可访问一个地方的每一个人,因此民调的直接结果不能不加以权重分配,以使得民调采得的样本能反映当地人口的特征。例如以固网电话进行的民调,很可能会使民调样本集中在中年女性之上,因此民调得来的结果就要给予其他年龄层和性别更多的权重,以反映这些群组在民调当地的人口比例。
然而,要选择什么特征去作权重,则是一个争议不止的难题。
到底在“特朗普奇迹”的阴影下,民调(以及以民调为基础的预测)还可以相信吗?
新冠疫情与“黑人的命也是命”(Black Lives Matter)示威的处理,一方面使特朗普失分,另一方面也使拜登民望上涨。(美联社)
学历高低成民调权重关键
第一,由于没有人能够为所有人口分类去作权重,我们必须选择一些与投票结果相关的特征去作衡量。例如,如果一个人的工作地区与他的投票倾向几乎没有关系的话,民调就不会以工作地区作为特征去作权重分配。可是,要筛选出有意义的权重特征却非易事——这更造成了2016年选举民调的一大失误。
当年的全国性民调显示希拉里会胜出普选票大约3%,最终希拉里的普选票的确比特朗普多2%,其准确度其实不低。同时,美国大选民调对普选票的预估与实际结果误差,已从1936年的12个百分点,跌至2016年的两个百分点左右,属史上一大低点。其实,当年估计失误的主要问题不是出于全国民调,而是出于各州民调。
在2016年大选以前,民调机构普遍认为学历高低并不是影响投票倾向的主要因素,因此即使学历高低与民调访问回应率有正向关系,不少州份的民调机构也没有将学历作为权重分配的一部份。这在2012年的选举中影响不大,因为当年占人口比例较高的本科毕业人士小规模倾向投票给共和党,而占人口比例较低的硕士或以上毕业人士则明显倾向支持民主党,两者相减之后,即使高学历人士更愿意接受民调访问,这现象也不会构成太大影响。
路透社曾报道,如果特朗普民望未见起息,参议院多数党领袖麦康奈尔(Mitch McConnell)有可能会建议共和党参议院候选人与特朗普保持距离。(美联社)
然而,到了2016年的选举,学历高低与会否投票支持民主党却成为了明显的正向关系,无论是在全美国的层面,还是在当年特朗普胜选的关键州份宾夕法尼亚州(Pennsylvania)、密歇根州(Michigan)、威斯康星州(Wisconsin)亦是如此。然而,当年选举之前,民调机构当然也没有“先见之明”,在上述三州有将学历高低作权重分配的民调只占总数18%至33%不等,而在全国层面,有近半民调也没有计算这个因素。最后,当然是大大失算收场。
汲取了这个教训,本年不少民调机构也将学历采用为权重特征之一,相信2016年之误该可解决。
特朗普支持者拒绝回应民调 或造成误差
不过,在如今特朗普终日大骂(对他不利的)民调“造假”之际,特朗普的支持者也许会更倾向拒绝民调访问,民调机构在权重分配问题上似将遇上另一难题:到底“党派认同”应否作为权重分配的人口特征之一?
特朗普对于不利自己的民调经常作出毫无根据的批评,除了《纽约时报》以外,连一直力挺特朗普的福克斯新闻也不放过。(Twitter@realDonaldTrump)
此权重的根本问题在于,与年龄、性别、学历等相对固定的人口特征不同,党派认同并不能从官方人口普查的数据中得到确切数字,因此民调机构若要以党派认同作权重分配的话,也只能自行估算,或者依赖前次选举的票站调查数据作准。对此,美国全国民调评议会(NCPP)就批评以党派认同作权重“是个猜测游戏多于好的理论”。
虽然根据美国民意研究学会(AAPOR)对2016年大选民调的详细研究,他们惊讶地发现其实民调即使没有权重分配,也没有压抑特朗普支持者的民意;然而,这会否因为特朗普大骂民调而改变,则尚属未知之数——如果共和党人因特朗普的言论而拒绝回应民调的话,党派认同的权重争议也可能会构成民调结果与现实之间的落差。
选民拿不定主意的难题
除了难解的权重问题之外,2016年的民调错估,还有“选民到最后一刻才作出投票决定”的问题。
回顾当年,到了两党选情炽热的8月底,根据当时一项《经济学人》与YouGov的大选民调,支持第三党候选人或其他人、不确定投票选择,以及可能不投票的受访者占所有受访者高达21%。而根据上述美国民意研究学会的报告,美国全国有13%选民到选前最后一个星期才作出投票决定,此类选民投票给特朗普的比例比投给希拉里的高出3个百分点,而在左右大选的宾夕法尼亚州、密歇根州和威斯康星州,这个差距更分别高达17、11和29个百分点。
特朗普在2016年的竞选成功,得益于人们对类似他的对手希拉里(Hillary Clinton)式政客的厌恶。图为2016年两人在总统竞选阶段的电视辩论。(路透社)
两党之间投票意向不明的选民比例如此高,当然促成了当年民调预测失准。然而,如今美国两党分裂成风,选民投票意向的确定性就远较2016年为高。根据《经济学人》与YouGov在本年同在8月底进行的民调,表示将投票给其他人、不确定或不投票的受访者比例只得8%,比上述数字低一倍以上。因此,可以预见,本年的民调预测的准确度,至少在此层面而言,会比2016年为高。
在大选民调较普遍加入学历水平权重、选民投票意向较早确定的情况下,本年的美国大选民调原则上应该会比2016年更有参考价值。不过,这次大选民调的一大变数却是网上民调的冒起。
网上民调大行其道
过去,民调通常透过固网或手提电话号码随机抽样进行,然而由于人们的回应率比过去大幅下滑——根据皮尤研究中心(Pew Research Center)的数字,其在1997年的回应率为36%,到了2019年底则只余6%——使用电话进行民调的成本越来愈高。于是,随着互联网的普及,网上民调就大行其道,目前常被引用的美国选举民调机构,诸如YouGov、哈里斯民调(Harris Poll)、莫宁咨询(Morning Consult)也有将民调移至网上。
根据《纽约时报》5月的一篇文章统计所得,本年4月期间美国有半数进行特定州份大选民调的机构皆使用网上民调;相较之下,在2018年中期选举最后三周,只有10%期间有进行选举民调的机构使用网上民调。
当然,网上民调也是种类繁多、可靠度不一。例如皮尤研究中心就会以传统手法随机拣选目标受访者,再通知他们回应网上民调问题,并为不能作回应网上民调的目标受访者提供“网下”的选项。
美国新冠疫情迟迟未除,人们宣誓入籍美国也要做足安全措施。(美联社)
可是,不少机构为减省成本,则采用“主动选择加入”(opt-in)的网上民调手法,再透过背后的各种人口数据,以复杂的权重分配方式,去用低成本的手段试图做到传统民调反映关乎全体民众现象的目标——YouGov就是此中的表表者。
然而,由于要求受访者“主动选择加入”使民调失去了抽样的随机性,此等民调的准确度也未必能有保障。皮尤研究中心一项2016年公布的研究就显示,网上民调的误差,与全国性联邦调查作比较的话,可高达6至10个百分点。网上民调涌现会否导致本年大选民调再次失准,确实值得观察。
上文分析完大选民调的各种准确性考量后,我们也许可以回到原来的问题:到底此刻的大选民调还可以相信吗?
答案当然是:可以信,但不能尽信。说到底,民调其实只是以简单的数字去呈现复杂现象的尝试。正如我们用一纸大学文凭去代表一个人的知识水平一般,没有简单的呈现,我们难以有效了解世事,然而简单的呈现本身却不能被等同于复杂的现象。
更重要的是,选举民调本身其实就是选战之中的其中一个能够左右选情的力量,能够左右候选人整个竞选工程的走向。试问一个牌局内的人又怎能确切地反映整个牌局?大选民调的参与价值确有高低之别,可是它们只能是选举的一个侧面,永远不能观照全局。
相关文章: