2020大选--拨开风向标县的迷雾

S
SwiperTheFox
楼主 (文学城)

众多2020年大选舞弊的所谓证据里, 我觉得老地雷说的风向标县的这个统计“证据”还真的值得研究一下, 故花点时间研究了她的文章及引用的维基百科网页, 专注于民意调查分析的网站538, 和一篇美国国家科学院刊的论文, 把这件事彻底搞清楚。 

一, 老地雷关于风向标县的Claim.

【注,请注意Claim与有效结论的区别】

老地雷说, 根据维基百科, 有19个风向标县--每次大选从1980到2016年都选对的了大选的赢家。 在2020年18个第一次选了失败者川普, 只有1个选了拜登。  这在统计上几乎是不可能的事, 所以大概率民主党窃取了2020年大选。 

二,对老地雷一文的漏洞的表面分析。 

我这里说老地雷的漏洞而不是说她造谣, 是因为我认为老地雷是认真经过了分析的,诚心诚意地认定2020年大选被偷, 不是故意撒谎。

根据老地雷所引的同一个维基百科网页,你会发现2016年的失败者克林顿赢了14个风向标县。   2020年失败者赢了18个风向标县, 这么一比较,至少从表面上看,2020年就没有那么离谱。 而且,   如果光靠风向标县说话,那如果克林顿说2016年大选被共和党舞弊偷了也会是很有道理的。   也就是说老地雷因confirmation bias, 因为没看见,忽略了对她不利的证据。 

三,对老地雷一文的漏洞的深入分析。 

如果你再仔细看老地雷引用的维基百科网页, 你会发现, 2012年及以前,风向标县投给失败者的大多只有一两个, 1992 的5个就有点例外了。  “反常”是从2016年开始。 

专注于民意调查分析的网站538也了给出了类似的数据。 538的数据是在2016年前,一共有35个风向标县, 其中19个投给了胜利者川普,16个投给了失败者克林顿。这么看, 自2016年起,风向标县已经不是风向标县, 而是大至50-50的分化现象了(这里没有说是随机现象是有道理的, 原因见第五节)。  克林顿赢的这14个风向标县, 在2020年都投给了拜登。(这里538与维基有2个县的出入, 我没有花时间去追究)。 

538网站不但给出了统计数据,而且还给出了合理解释: 投给克林顿和拜登的风向标县比起投给川普的风险标县更种族多样化, 而且受教育程度更高。  由于美国在政治上的两极分化, 过去的摇摆县(也就是风向标县)从2016年就开始站队了。  川普特别受无大学学历的白人的支持,也符合者19个风向标县profile (这里只指出事实,不做价值判断).

四, 美国国家科学院刊的分析.

这个解释也符合美国国家科学院刊给出的数据与分析。   

用人口构成的预测: 美国国家科学院刊,用人口构成做了统计模型, 预测的结果就是拜登平均应该赢1.65个风向标县。  用其他模型预测的结果是他应该赢1.2 到1.8个风向标县。 

对证两极分化: 从整体来看,不管是不是风向标, 2016年投给克林顿的县,基本上在2020会投给拜登; 而2016年投给川普的县,2020基本都会投给川普。在全面三千多个县里只有63个从川普改投了拜登。 所以说在2016年都投给川普的“风向标县“在2020再次基本上都投给川普并不奇怪(因为”大家都这样“)。 

美国国家科学院刊还给出了对其他“统计舞弊谈”的研究, 有兴趣的读者可以自己去学习。 

五, 风向标县的本质。

其实风向标县没有什么特别的原理, 就是个统计常识。  在没有两极分化的条件下, 对于一个普通的县, 每届都猜对是一个小概率事件, 但是当样本足够大的时候, 小概率事件就成了必然,并不是说这个县有什么特殊的地方, 有水晶球能预测大选结果。  就像你玩德州扑克,出现同花大顺的概率是很低的。 但是你一直玩,天天玩,这一辈子碰上一个或几个同花大顺是必然的。 

在两极分化的条件下,这个县的大选结果,基本上是可以由这个县的人口种族, 年龄, 教育程度等变量预测,  选举结果就不再是随机事件, 所以风向标县也就随之消失了。

六, 总结。

统计是一个可以帮我们发掘真相的有用的工具, 但是统计数据本身是事实,不是真相。要得出正确结论, 我们一是要看的全面, 不要忽略对结论不利的数据,二是要不停留在统计数据本身上面,而是要给出合理解释。 概率模型是个模型, 是在“理想状态”下的规律。  我们面对现实问题, 要明白现实里的假设哪点符合概率模型, 哪点不符合, 那个条件变了, 使得适用于以前的概率模型不再适用了, 能对现实问题给出合理解释,并能接受各方面事实的考验才能得出和确认自己的结论代表着真相。

o
olcbps
这篇要赞一个,有讨论问题的诚心 希望石头能够回应,也希望你能解释石头关于人气差别的疑问
S
SwiperTheFox
关于人气

首先应该承认拜登竞选集会的观众人数少。 

但是用人气多少开预测最后胜负有很大的差距。 有着如下诸多不成立的假设,结论自然就不成立。  

1.  双方在Marketing 上下的功夫同样多, 同样鼓励选民参与。

这在2020年是完全不成立的假设。拜登如果去哪里演讲, 因新冠的原因,并没有过多鼓励选民参与, 就算来了,也要保持社交距离。  所以人烟稀少。   川普去竞选演说,鼓励选民参与,不遵守社交距离。  共和党选民跟多地不买新冠的帐, 所以毫无顾忌地去参加集会。  人数的差别并不代表双方的热情程度。  假设不成立

以上这一点是决定性因素。 

2.  双方的选民参与竞选集会的热情与投票率成正比。 

比如,现在的民主党比起共和党选民来说更关心政策而不是口号,  川普是表演型的“候选人”, 他的演讲更“有趣“,所以更有号召力。   

我没有参加集会的热情, 选举上,多一事不如少一事, 能邮寄,就不等到选举当天排队。 

所以竞选热情转换为选票这一假设不成立。 

 

o
olcbps
关于人气,还必须解释为什么能超越民主党精神领袖欧巴马总统
t
tt10
两个烂党,哪有什么精神领袖, 只不过几个能说会道的俗人罢了,,,
S
SwiperTheFox
首先,奥巴马不是民主党精神领袖。其次,整个选举turn out 都增加了,这不是2020才有,在2018中期选举

 整体Turnout都是40年来最高。

第三, 从民主党角度讲, 受够了川普。 在包括我的众多民主党认为, 川普是史上最差总统, by far .  所以一定要投票把他选下去。 

老键
美国人挺戏精的,搞得好像每天都在选举,结果关键一刻就就几个人把票放入箱里

澳洲从宣布大选允许两党开始选战到投票就三个月,但96%的人投了票

S
SwiperTheFox
澳洲人民更有智慧
老键
就是,美国这样每天剑拔弩张的全民演习,搞得很多人都误以为自己已经投过票了
S
SwiperTheFox
现在更严重的问题,不但要整天关心未来的选战,还要不断relitigate多方证实的已成过去时的公正选举。 以此利用

用捐款来公饱私囊,同时破坏选举制度。 

t
tt10
没什么人关心选举。但不妨碍某些人经常无事实依据挑起这些话题,,