Big data看大选

b
bogey
楼主 (北美华人网)
有趣的分析。 本来自己想做的, 发现网上有人做了。 转载给大家看看(没经过博主的同意啊)。 ------------------------------------------ 正常的选票,一般会从总统候选人直到参议员、国会议员,州议员,郡官员,完成大部分选项。现在大部分州都不提供STV(Straight Ticket Voting)选择了,即全部投给同一政党候选人的选票,所以必须逐个选择。假设我特别恨川普,想制作大批邮寄选票把他赶出白宫,又不能用STV选项,那么最快的方法就是在选票上只选择拜登,而忽略其他选项。如果一个州有很多这种奇怪的“只选拜登”的选票,在选举数据上会反映出来。
数据的第一个特点是所有总统候选人的票数远远超出所有参议员(或众议员)候选人的票数;第二个特点是拜登的票数会远大于民主党参议员(或众议员)候选人的票数;第三个特点是拜登的票数与民主党参议员(或众议员)的票数之差远大于川普的票数与共和党参议员(或众议员)之差。用来自CNN和谷歌的大选数据,随手分析了几个州的选举数据,见附图。发现这些特点在几个摇摆州都比非摇摆州显著。

非常有趣的是,几个一夜反转的州,这些特点都比较显著。像密奇根,宾州,威斯康辛和乔治亚州。
宾州和威州的川普得票数与共和党议员的票数之差呈负数(B-Y),也有可能一些支持共和党的选民不喜欢川普,他们选了共和党参议员,但给拜登投票。但是这些负数的绝对值仍然小于拜登和民主党参议员的得票之差(C-Z),说明仍然有一些“只投拜登”的可疑票存在。
综上所述:在数据中,如果发现某些州的选票统计同时满足: 条件1 A-X>>0,只选总统,不选参众议员的票很多; 条件2 C-Z>>0;即拜登的票数远大于民主党参议员票数; 条件3 C-Z>>B-Y;即存在民主党和共和党的不对称性; 条件4 If B-Y<0,|C-Z|>>|B-Y|,即排除了对川普不满的共和党选民。 可以怀疑这些州有大量的奇怪选票:即只选拜登的选票。 这里>>表示远大于,而|x|表示x的绝对值。
而密奇根,宾州,威斯康辛和乔治亚这些战场州,都满足这4个条件。刚刚看到一个视频采访川普竞选团队的律师Sidney Powell,她宣称在以上4州和其他州发现了45万张“只选拜登”的奇怪选票,并将就此时发起作弊的法律诉讼。
F
FTrumptards
亚利桑那州大量共和党人, 爱戴mccain 总统票弃投, 有很难懂吗?
梅干茶泡饭
第三党派:呜呜呜
y
ywwh68
赞👍用数说话。
s
safari
亚利桑那州大量共和党人, 爱戴mccain 总统票弃投, 有很难懂吗?
FTrumptards 发表于 2020-11-10 15:44

这个论点可以理解,那体现在数据上,只能解释选共和党议员的票数应该多于选Trump的票数,但是不能解释选Biden的票数多于民主党议员票数,以及楼主说的其他的一些trend。楼主有没有Arizona的数据啊?
i
imemine
数据说话👍
s
senia
回复 2楼FTrumptards的帖子
楼主拿的是数据,还有source,你就一个“大量”,来点数据和分析好吗?
l
lianzi
相比较阴谋论我还是觉得science比较有说服力。
http://www-personal.umich.edu/~wmebane/inapB.pdf
S
SSBN826
赞lz用数据说话! 不过是不是应该用百分比而不是绝对票数更合理?
u
uglyduck
假如民主党系统舞弊实锤,点出来的legal votes又比共和党多,这种情况怎么办呢?
C
Chiaseed
辱大数据了
b
bogey
这个论点可以理解,那体现在数据上,只能解释选共和党议员的票数应该多于选Trump的票数,但是不能解释选Biden的票数多于民主党议员票数,以及楼主说的其他的一些trend。楼主有没有Arizona的数据啊?
safari 发表于 2020-11-10 16:04

Arizona的数据。 does not look very out of whack.
b
bogey
赞lz用数据说话! 不过是不是应该用百分比而不是绝对票数更合理?
SSBN826 发表于 2020-11-10 16:33

it is a good question. 我觉得不用百分比而用绝对票数, 是避免让这个分析看上去是统计误差。
b
bogey
辱大数据了
Chiaseed 发表于 2020-11-10 16:56

你能不能来点真实的分析而不是空泛的口号。typical .
b
bogey
相比较阴谋论我还是觉得science比较有说服力。
http://www-personal.umich.edu/~wmebane/inapB.pdf

lianzi 发表于 2020-11-10 16:32

totally agree. 任何人为的操纵数据, 都逃不过science的法眼。 我不是做数据分析的,但对大选的数据做一些认真的统计分析, 一定能去为伪存真。
P
Perseus2000
回复 1楼bogey的帖子
一扫就看不下去呢,能先把第三党总统候选人的票加上去再大数据吗?
s
sunmy164
赞技术贴,顶上去!
c
crazymutt
相比较阴谋论我还是觉得science比较有说服力。
http://www-personal.umich.edu/~wmebane/inapB.pdf

lianzi 发表于 2020-11-10 16:32

这个作者的最大问题是没啥基本科学素质。。。虽然是umich prof (我就不评论race还有这么多年的citation了。。)
下面引用他的原文: “The Biden/Harris ticket on average received a proportion of about .82 of the votes, and the Figure shows that the shape of the Biden/Harris vote count distribution pretty closely mirrors the shape of the distribution of votes cast.”
就列个简单公式 votes 总数 = B + T votes 总数 = 作假一方数量+没做假一方数量
作假做的多了,当然就像votes总数了。。
C
CBOE
不错👌……呵呵😄
b
bogey
回复 1楼bogey的帖子
一扫就看不下去呢,能先把第三党总统候选人的票加上去再大数据吗?
Perseus2000 发表于 2020-11-10 17:33

你一扫就看不下去, 就说明你没仔细看。 第三党总统候选人的票虽没有列出来, 但已经加在所有总统候选人得票数里了 (note: A>B+C). 如果你认为没有把第三党总统候选人的票单列出来, 有misleading之嫌,我同意, 所以在Arizona的得票里把这一项加上了。 但这并不影响后面的分析, 原作也说明了要满足多项才能让人质疑。 total总统得票远超total Senator得票,并不能全用3rd party来解释。 Again, 任何人为做票就会留下痕迹, science定能去伪存真。有这方面的高手可以试试。
H
Haribough
回复 1楼bogey的帖子
好像不止是摇摆州有这个问题。我刚才看了德州和田纳西(这可能是两个最大的深红州。我本来还想算佛罗里达,但是佛州只有众议员选举,录数据太麻烦)
| TX | TN A | 11242976 | 3034249 B | 5865913 | 1849211 C | 5218631 | 1139666 X | 11078238 | 2911918 Y | 5937863 | 1838001 Z | 4850894 | 1037017 A-X | 164739 | 122331 B-Y | -71950 | 11210 C-Z | 367737 | 102649
要按人口比例,这两个州绝对比那几个摇摆州更严重。是不是可以考虑先在红州举报一下,让他们查一查?