我下载了,正在看那个小文件,里面有36个columns,有好多column意思我不明白,我 贴上来,您老给解释一下好吗? Voter Reg Number LastName FirstName MiddleName Suffix Voter Status --> 这个有2种状态,Active and Inactive, Inactive啥意思?是不能 投票的意思吗? Voter Status Reason Voter Type Address1 Address2 HouseNumber StreetName UnitType UnitNumber ZipCode Mailing Address1 Mailing Address2 Mailing CityStateZip Phone Number Email Address Jurisdiction County Abs Application Date Application Source Application Type Absentee Address Name Election Name Ballot Reason Type Ballot Type Ballot Status District Combo WARD NAME Ballot Status Reason Ballot Delivery Method Date Ballot Sent Date Ballot Returned
这是我利用 Ballot Delivery Method Column 做了一个GroupBy的结果: Voted In Person, 2447625 Mail, 4431617 , 329584 Email, 51406 Special Voting Deputy, 211716 Appointed Agent, 12115 Online, 8525 Fax, 164 City of Kiel - Ward 1, 1 Returned, 6 Ballot Not Returned By Deadline, 2
除了Voted In Person 和 Mail 之外,还有 Email, Special Voting Deputy, Online...
初步认为大文件有3.7 million 有效选民。估计小文件有2.2 million early vote 选 民, 其中1.4 million 是mail-in的选民,偏向民主党, 0.7 million early in- person vote, 偏向共和党。大文件选民除去小文件选民,可能11/3日选举日去投票站 亲自投票的,也有部分可能未投票。
【 在 bigCat2012(大猫一只) 的大作中提到: 】
: ok, under the column "Election Name", 和 2020年大选有关的有两个option
: 2020 General Election, 2,152,454 人投票
: 2020 Spring Election and Presidential Preference Vote, 1,320,746 人投票
: 这个2020 Spring Election and Presidential Preference Vote 是个什么鬼?是不是
太好了!!
看美新版有没有人才分析一点什么出来。
哈哈,发动群众,挖起来又快又好。
DING
也不是有了數據就一定可以看出端倪,如果不知道數據的意義,數據解讀不對,什麼分析都枉然。
顶
今天超忙,这会看了看数据,
第一个数据能查到1,230,771本次选民,里面居然有745,412是MAIL IN,占60%,去投
票站的只占40%。有大约五万八,前面几次大选都没选,平时也不怎么参选,出现在
MAIL IN里面,这部分人是查的重点,需要更多数据来看是不是还住在这里,还是新选
民。新注册的选民数据,每个COUNTY里面都有。住不住那里,看UTILITY是比较准确的。
第二个数据格式有问题,使劲找了找,能找到322,028本次选民,里面有115票是重复的票,和第一个数据比较,有44,464是重复的选民
威斯康辛州本次投票是3.2M,不知道这两个数据全不全。第一个数据不错,但缺少生日信息,不知道是不是卖数据的给掐了。 欢迎讨论,一起琢磨。
【 在 FA8 (三块方糖) 的大作中提到: 】
: 今天超忙,这会看了看数据,
: 第一个数据能查到1,230,771本次选民,里面居然有745,412是MAIL IN,占60%,去投
: 票站的只占40%。有大约五万八,前面几次大选都没选,平时也不怎么参选,出现在
: MAIL IN里面,这部分人是查的重点,需要更多数据来看是不是还住在这里,还是新选
: 民。新注册的选民数据,每个COUNTY里面都有。住不住那里,看UTILITY是比较准确
的。
: 第二个数据格式有问题,使劲找了找,能找到322,028本次选民,里面有115票是重复的
: 票,和第一个数据比较,有44,464是重复的选民
: 威斯康辛州本次投票是3.2M,不知道这两个数据全不全。第一个数据不错,但缺少生日
: 信息,不知道是不是卖数据的给掐了。 欢迎讨论,一起琢磨。
我下载了,正在看那个小文件,里面有36个columns,有好多column意思我不明白,我
贴上来,您老给解释一下好吗?
Voter Reg Number
LastName
FirstName
MiddleName
Suffix
Voter Status --> 这个有2种状态,Active and Inactive, Inactive啥意思?是不能
投票的意思吗?
Voter Status Reason
Voter Type
Address1
Address2
HouseNumber
StreetName
UnitType
UnitNumber
ZipCode
Mailing Address1
Mailing Address2
Mailing CityStateZip
Phone Number
Email Address
Jurisdiction
County
Abs Application Date
Application Source
Application Type
Absentee Address Name
Election Name
Ballot Reason Type
Ballot Type
Ballot Status
District Combo
WARD NAME
Ballot Status Reason
Ballot Delivery Method
Date Ballot Sent
Date Ballot Returned
这是我利用 Ballot Delivery Method Column 做了一个GroupBy的结果:
Voted In Person, 2447625
Mail, 4431617
, 329584
Email, 51406
Special Voting Deputy, 211716
Appointed Agent, 12115
Online, 8525
Fax, 164
City of Kiel - Ward 1, 1
Returned, 6
Ballot Not Returned By Deadline, 2
除了Voted In Person 和 Mail 之外,还有 Email, Special Voting Deputy, Online...
这些都是什么鬼?可以Email投票?5万多票。。?
Voter Status --> 这个有2种状态,Active and Inactive, Inactive啥意思?是不能
投票的意思吗?这是个好问题,具体原因就在下面一个column里“voter status
reason” 我认为是各种形式废票。
Voter Status Reason
其他column你基本都能看懂
【 在 bigCat2012 (大猫一只) 的大作中提到: 】
: 的。
: 我下载了,正在看那个小文件,里面有36个columns,有好多column意思我不明白,我
: 贴上来,您老给解释一下好吗?
: Voter Reg Number
: LastName
: FirstName
: MiddleName
: Suffix
: Voter Status --> 这个有2种状态,Active and Inactive, Inactive啥意思?是不能
: 投票的意思吗?
: ...................
你得focus在NOVEMBER2020出票的人上,才是本次大选的出票人,另一个要找11/03/
2020投票的和10月底early voting的人,才是本次大选的选民。
【 在 bigCat2012 (大猫一只) 的大作中提到: 】
: 这是我利用 Ballot Delivery Method Column 做了一个GroupBy的结果:
: Voted In Person, 2447625
: Mail, 4431617
: , 329584
: Email, 51406
: Special Voting Deputy, 211716
: Appointed Agent, 12115
: Online, 8525
: Fax, 164
: City of Kiel - Ward 1, 1
: ...................
DING
【 在 FA8 (三块方糖) 的大作中提到: 】
: 你得focus在NOVEMBER2020出票的人上,才是本次大选的出票人,另一个要找11/03/
: 2020投票的和10月底early voting的人,才是本次大选的选民。
ok, under the column "Election Name", 和 2020年大选有关的有两个option
2020 General Election, 2,152,454 人投票
2020 Spring Election and Presidential Preference Vote, 1,320,746 人投票
这个2020 Spring Election and Presidential Preference Vote 是个什么鬼?是不是和Nov大选没关系?那我就重点分析 2020 General Election 这200万人了
顶
【 在 bigCat2012 (大猫一只) 的大作中提到: 】
: ok, under the column "Election Name", 和 2020年大选有关的有两个option
: 2020 General Election, 2,152,454 人投票
: 2020 Spring Election and Presidential Preference Vote, 1,320,746 人投票
: 这个2020 Spring Election and Presidential Preference Vote 是个什么鬼?是不是
: 和Nov大选没关系?那我就重点分析 2020 General Election 这200万人了
我技术看来不行,文件打不开。用excel 吗?
【 在 Ldyyly () 的大作中提到: 】
: 我技术看来不行,文件打不开。用excel 吗?
别说excel,任何市面上免费的notpad都打不开,小文件2G,大文件5G
我用C# LINQ分析,直接line by line读取源文件,楼上那位大神估计是导入数据库分
析
【 在 fishingarden (Edward Blum门下老王) 的大作中提到: 】
: http://gofile.io/d/XwcWGo
哪里可以查到WI过世人员的信息?
初步认为大文件有3.7 million 有效选民。估计小文件有2.2 million early vote 选
民, 其中1.4 million 是mail-in的选民,偏向民主党, 0.7 million early in-
person vote, 偏向共和党。大文件选民除去小文件选民,可能11/3日选举日去投票站
亲自投票的,也有部分可能未投票。
【 在 bigCat2012(大猫一只) 的大作中提到: 】
: ok, under the column "Election Name", 和 2020年大选有关的有两个option
: 2020 General Election, 2,152,454 人投票
: 2020 Spring Election and Presidential Preference Vote, 1,320,746 人投票
: 这个2020 Spring Election and Presidential Preference Vote 是个什么鬼?是不是
: 和Nov大选没关系?那我就重点分析 2020 General Election 这200万人了
【 在 tankerw (tankerw) 的大作中提到: 】
: 初步认为大文件有3.7 million 有效选民。估计小文件有2.2 million early vote 选
: 民, 其中1.4 million 是mail-in的选民,偏向民主党, 0.7 million early in-
: person vote, 偏向共和党。大文件选民除去小文件选民,可能11/3日选举日去投票站
: 亲自投票的,也有部分可能未投票。
:
: ok, under the column "Election Name", 和 2020年大选有关的有两个
option
:
: 2020 General Election, 2,152,454 人投票
:
: 2020 Spring Election and Presidential Preference Vote, 1,320,746 人
投票
:
: 这个2020 Spring Election and Presidential Preference Vote 是个什么鬼?
: 是不是
:
: 和Nov大选没关系?那我就重点分析 2020 General Election 这200万人了
: ...................
这个是大文件的120 个 Columns,简直乱成一团,把所有信息混在一块,5G的文件大部分是没用的信息:
Voter Reg Number, LastName, FirstName, MiddleName, Suffix, PhoneNumber,
EmailAddress, Address1, Address2, MailingAddress1, MailingAddress2,
MailingCityStateZip, HouseNumber, StreetName, UnitType, UnitNumber, ZipCode, Jurisdiction, DistrictCombo, Ward, Congressional, State Senate, State
Assembly, Court of Appeals, Multi-Jurisdictional Judge, County, County
Supervisory, Municipality, Aldermanic, School, High School, Sanitary,
Technical College, Representational School, State, District Attorney,
Circuit Court, First Class School, Incorporation, Voter Status, Voter Status Reason, ApplicationDate, ApplicationSource, IsPermanentAbsentee, Voter Type, November2020, August2020, May2020, April2020, February2020, April2019,
February2019, November2018, October2018, August2018, June2018, May2018,
April2018, February2018, January2018, December2017, April2017, February2017, November2016, August2016, April2016, February2016, December2015,
November2015, October2015, September2015, July2015, June2015, May2015,
April2015, February2015, November2014, October2014, September2014,
August2014, May2014, April2014, February2014, December2013, November2013,
October2013, September2013, May2013, April2013, February2013, December2012, November2012, August2012, June2012, May2012, April2012, February2012,
November2011, October2011, August2011, July2011, May2011, April2011,
February2011, November2010, September2010, April2010, February2010,
April2009, February2009, November2008, September2008, April2008,
February2008, April2007, February2007, November2006, September2006,
April2006, February2006,
其中我统计了一下November2020 Column的Group By信息,如下,还请解读一下是啥意
思?
Absentee, 745,412
At Polls, 485,357
Regular, 1
Permanently Overseas, 1
还有就是这个Voter Reg Number,这玩意作为PK,是全国唯一的?还是只在本州唯一?因为没有生日,很难查出死人票,外州重复投票也没法查,需要外州的类似信息;总之如果FBI要查,写几个SQL就能查出来。。
第一个数据能查到1,230,771本次选民,里面居然有745,412是MAIL IN,占60%,去投
票站的只占40%。有大约五万八,前面几次大选都没选,平时也不怎么参选,出现在
MAIL IN里面,这部分人是查的重点,需要更多数据来看是不是还住在这里,还是新选
民。新注册的选民数据,每个COUNTY里面都有。住不住那里,看UTILITY是比较准确的。
第二个数据格式有点问题,能找到1,200,321本次选民,剔除了原有201票是重复的
票,这部分和第一个数据不同选民, 所以差不多找到了2.4M本次选民(威斯康辛州本次投票是3.2M),这各数据里的选民voted in person只有393,524,占32.7%,其他都是非投票站点投票
还有80万左右选民没在数据里找到。 不过MAIL IN超过2/3,我个人认为WI大规模舞弊
已经发生了。如大家讨论的,只要找到生日数据,就知道死人票多少,只要找到
UTITLITY DATA,就能找到搬走的假票。这确实需要FBI的介入,另外VOTER_REG_NUMBER我觉得是各州不同的,这个早应该立法规范VOTER_ID,像搞一个SSN那样,一人只有一
个,来封堵漏洞。
【 在 bigCat2012 (大猫一只) 的大作中提到: 】
: option
: 投票
: 这个是大文件的120 个 Columns,简直乱成一团,把所有信息混在一块,5G的文件大部
: 分是没用的信息:
: Voter Reg Number, LastName, FirstName, MiddleName, Suffix, PhoneNumber,
: EmailAddress, Address1, Address2, MailingAddress1, MailingAddress2,
: MailingCityStateZip, HouseNumber, StreetName, UnitType, UnitNumber,
ZipCode,
: Jurisdiction, DistrictCombo, Ward, Congressional, State Senate, State
: Assembly, Court of Appeals, Multi-Jurisdictional Judge, County, County
: Supervisory, Municipality, Aldermanic, School, High School, Sanitary,
: ...................
2020 Spring Election and Presidential Preference Vote 应该不是本次大选的投票
【 在 bigCat2012 (大猫一只) 的大作中提到: 】
: ok, under the column "Election Name", 和 2020年大选有关的有两个option
: 2020 General Election, 2,152,454 人投票
: 2020 Spring Election and Presidential Preference Vote, 1,320,746 人投票
: 这个2020 Spring Election and Presidential Preference Vote 是个什么鬼?是不是
: 和Nov大选没关系?那我就重点分析 2020 General Election 这200万人了
【 在 FA8 (三块方糖) 的大作中提到: 】
: 第一个数据能查到1,230,771本次选民,里面居然有745,412是MAIL IN,占60%,去投
: 票站的只占40%。有大约五万八,前面几次大选都没选,平时也不怎么参选,出现在
: MAIL IN里面,这部分人是查的重点,需要更多数据来看是不是还住在这里,还是新选
: 民。新注册的选民数据,每个COUNTY里面都有。住不住那里,看UTILITY是比较准确
的。
: 第二个数据格式有点问题,能找到1,200,321本次选民,剔除了原有201票是重复的
: 票,这部分和第一个数据不同选民, 所以差不多找到了2.4M本次选民(威斯康辛州本次
: 投票是3.2M),这各数据里的选民voted in person只有393,524,占32.7%,其他都是
: 非投票站点投票
: 还有80万左右选民没在数据里找到。 不过MAIL IN超过2/3,我个人认为WI大规模舞弊
: 已经发生了。如大家讨论的,只要找到生日数据,就知道死人票多少,只要找到
: ...................
那个大文件里面好多行不是120 Columns,我还要专门写一个is column null的条件把
这些exceptions去掉
本次威州开票是3.2 MILLION
【 在 tankerw (tankerw) 的大作中提到: 】
: 初步认为大文件有3.7 million 有效选民。估计小文件有2.2 million early vote 选
: 民, 其中1.4 million 是mail-in的选民,偏向民主党, 0.7 million early in-
: person vote, 偏向共和党。大文件选民除去小文件选民,可能11/3日选举日去投票站
: 亲自投票的,也有部分可能未投票。
:
: ok, under the column "Election Name", 和 2020年大选有关的有两个
option
:
: 2020 General Election, 2,152,454 人投票
:
: 2020 Spring Election and Presidential Preference Vote, 1,320,746 人
投票
:
: 这个2020 Spring Election and Presidential Preference Vote 是个什么鬼?
: 是不是
:
: 和Nov大选没关系?那我就重点分析 2020 General Election 这200万人了
: ...................
用数据库软件导入数据
比如任何一款SQL,应该都行,然后你query需要的。
如果你用苹果电脑或者是Linux系统就简单了,可以用cmd 显示head或者指定多少行
我没兴趣去折腾这些数据只是觉得,造假是明摆着,翻盘也是肯定翻不了的,猪党既然敢造假就不怕你折腾。这些人没有下限。
我写了几行code 输出了前一百行http://www.mitbbs.com/article_t/USANews/34320467.html
【 在 Ldyyly () 的大作中提到: 】
: 我技术看来不行,文件打不开。用excel 吗?
只要有更多数据资源,查造假是很容易的
FBI,CIA应该给老川团队数据资源,几个小时就能查出舞弊!
【 在 paojiao (paojiao) 的大作中提到: 】
: 用数据库软件导入数据
: 比如任何一款SQL,应该都行,然后你query需要的。
: 如果你用苹果电脑或者是Linux系统就简单了,可以用cmd 显示head或者指定多少行
: 我没兴趣去折腾这些数据只是觉得,造假是明摆着,翻盘也是肯定翻不了的,猪党既然
: 敢造假就不怕你折腾。这些人没有下限。
: 我写了几行code 输出了前一百行
: http://www.mitbbs.com/article_t/USANews/34320467.html
WI early voting: Mail-in and early in-person ballots returned 1,889,178
67% MAIL-IN, 33% IN-Person, 这个基本符合现在有的数据。
早投时候两党的比例是 35%民主党, 43%共和党,22%独立选民
最后投票日那天没有公开的信息,最后总票3,289,528,所以最后一天出票 1,400,350