很难确保,2016年的时候poll就不准确。 推荐一本书:Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are 这里解释了2016年为啥poll不准确,但是google search可以预测结果
很难确保,2016年的时候poll就不准确。 推荐一本书:Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are 这里解释了2016年为啥poll不准确,但是google search可以预测结果 三省吾身 发表于 2020-10-17 17:05
poll不准,我觉得好理解。 google search 可以预测结果是说的什么?检索两个候选人的次数吗?
很难确保,2016年的时候poll就不准确。 推荐一本书:Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are 这里解释了2016年为啥poll不准确,但是google search可以预测结果 三省吾身 发表于 2020-10-17 17:05
回复 1楼公用马甲3的帖子 今天的新闻,给你参考下,民调确实有些问题,不能全信。 Biden campaign manager says national poll numbers are 'inflated' https://www.theblaze.com/news/biden-polls-inflated-campaign-manager The campaign manager for Joe Biden's presidential campaign warned that the national poll numbers were "inflated" and that their internal polls showed the race to be much closer than is being reported.
回复 1楼公用马甲3的帖子 今天的新闻,给你参考下,民调确实有些问题,不能全信。 Biden campaign manager says national poll numbers are 'inflated' https://www.theblaze.com/news/biden-polls-inflated-campaign-manager The campaign manager for Joe Biden's presidential campaign warned that the national poll numbers were "inflated" and that their internal polls showed the race to be much closer than is being reported. yainju 发表于 2020-10-17 17:45
从大数据中找金矿的多者呢,举个例子。 心理学家发现一个有趣的现象,做比较时,人们通常下意识的把自己喜欢和赞同放在前面。所以如果Google “Trump vs Hillary” 的比“Hillary vs Trump”的多,那么支持Trump的人就会多。这个当然有误差,但如果数据足够大,也可以很准的。
The home of Deana and Dennis Molla's home in Minnesota on fire A suspicious fire destroyed a detached garage and three cars at a Minnesota home that had a large “Trump 2020” presidential campaign sign outside, police said.
Feds investigating suspicious fire at Brooklyn Center home with 'Trump 2020' sign By Courtney Godfrey and Allie Johnson Published September 23
我就是想请教个问题,现在这民调那民调的天天出数据,那民调机构怎么确保接受民调的人不撒谎呢?比如AB两个竞选人,明明自己支持A,但告诉民调机构自己选B,这种情况会发生吗?民调机构又是怎么能把这种误导数据的因素排除的呢?
再强调一遍,我不占任何一方,不带风向,版上吵得大衣都不敢上,怕被骂,怕被查历史,咱就是纯科学请教啊!
最后预祝贵国总统大选顺利完成,祝愿美国大选后两党和各自的支持者能团结起来,社会也和谐起来。我去过新西兰,澳大利亚好些国家, 真心说,美国还是挺好的一个国家的,但天天这么吵吵真让人头大啊。
🔥 最新回帖
川粉从来都不要脸,整天就是撒谎造谣+传播fake news。。。
完全是不同的认知程度,希望这次的事情也是全民科普的一个好机会。 隔壁还有非要重症科医生讲防疫知识的。人家都说了防疫方面和大家知道的差不多,疾病传播要看流行病的统计,重症治疗会因为患者的病情千差万别,普通人也没办法借鉴。
发了假消息被打脸居然还有脸回来骂架。川粉果然心里强大,散一个假消息,被打脸,再找几个继续散,再被打,循环往复。然后慢慢的沉默的大多数就看明白了,这就是这几个月huaren的trend
有个理论的, 从统计学的角度上来说, 只要样本选得好, 1千多人就可以代表全部得Population了。
🛋️ 沙发板凳
感觉不会只靠人的诚实吧,没有更科学的解释吗?
民调结果怎么查呢? 如果你说的和你最后投的不一致,这怎么能查出来? 还有接受民调,有填表费或者小礼物奉上吗?还是?
是小留吗? 版上叔叔阿姨那种吵架气势没吓着吧?
也许以前的民调还有一定参考价值,现在横空出现一个大bug叫政治正确,并且在此问题上犯过错误的人,真的会丢掉工作,被人鄙视,唾弃等等后,民调的真实性就没有办法再保证了。现在民调的目的已经不是准确预测结果了,而是配合引导舆论和可能出现的其他问题作掩饰。
小刘别怕,这个问题挺好的,其实老刘我也有这个困惑呢。
我直觉现在不是这样的,肯定会有人故意反着说。占多大比例,不清楚。其实楼主小刘这个问题真挺好的,我也一直搞不清楚。
这个倒是可以告诉你,查不出来,个人投的票都是高度隐私的,民调机构拿不到结果的。
填表费也是没有的。
我没有数据,但我觉得概率不会一样,社会气氛,对民调机构的态度等等,都会导致撒谎的比例不同。
对,尤其在大公司工作的人,绝对不会暴露自己的政治倾向
我觉得叔叔吵架的不多,吵架的多是阿姨们么。五毛除外哈
首先强调下pollster里,不是所有的都是political的,很多做的是商业的poll. 打个比方,某时尚公司想知道大家想要什么颜色的包包,于是hire一个外界pollster来调查一下大家的喜好, 决定明年做什么包包。这样更常见。这是一个非常大的industry.
political poll里,大家在电视上看到的是都是免费向民众公布的public的poll,也就是常见的YouGov, Emerson, Quinnipiac等结果。实际上竞选团队和一些利益相关的机构(比如股市相关的)会去花钱买private的poll, 比如Kellyanne Conway就是做pollster起家,她的Twitter账号就叫@KellyannePolls。这些private 的poll更有针对性,通常更为准确尖锐,但是你不会在电视上看到。
民众看Poll关心的是谁会赢。而竞选团队关注的是如果制定策略,下一步还有那些人可以争取,资源怎么分配。
毕竟美国的制度在绝大部分州是赢者通吃。
希拉里是资源分配的大输家,用在AZ等地的资源稍微倾斜一下Blue Wall结果就会大不相同。实际上她“辛勤耕耘”“开动马力”的主攻的地方取得的成绩是不错的,比如NH这样很难赢的州。 而Trump在Kellyanne的精准民调指挥下,精准的把更少的资源投放在关键的地方,在WI MI PA都是<1%的差距赢下整个州。可以说是世纪经典了。
下面只说大家能看到的public poll
然后说一下2016年的poll到底出了什么问题。 实际上2016年的poll最后并没有错得“离谱”,主要问题集中在Blue Wall也就是现在说的中西部摇摆州。 这里有两个原因, 1 由于投票规则原因,中西部州大选日投票占比例极高,收到FBI bomb的影响最大。每一个poll都需要时间conduct,最后几天来不及了。 2 白人无大学学位男性这个voting block 取样不够。
第一个问题从pollster角度无法避免。第二个问题pollster现在都在拼命“矫正”。
大家现在会看到不同的poll出来的结果不同,原因主要在取样方式上。 如果我可以调查所有德州选民,那么我的预测肯定是最准确的,但是这不可能操作。 如果我取样里90%是奥斯丁居民,10%是红脖子,那肯定Biden躺赢了。反过来也肯定Trump躺赢:)
每个pollster的model都是不一样的。 一般来说会考虑到这个州的投票传统 比如 1 选民比例- 看一下此州的GOP:DEM:Independent选民注册比例。 (有些州并不按照party注册但是可以预计) 2 选民投票热情 (turnout) 3 也有很多其他参数 一般来说很多摇摆州 GOP注册选民少于DEM,而GOP选民的turnout高于DEM。(老头老太turnout最高,年轻人turnout最低)。GOP选民的turnout热情的区间跨越小很稳定。DEM选民的turnout却是过山车,有时倾巢而出,有时不肯出来。 所以很多model会给GOP取样这边提高一点weight来计算结果。
因为取样model的不同。pollster也会有“左右”之分。有的更偏左,有的偏右。有些pollster甚至是GOP/DEM internal. -这种pollster并不是"中立“的,而是和党派合作的,通常会非常pro这个党派。所以说如果这种internal poll都崩了,那就真的崩了。。。 所以看趋势的时候不妨多看看同一个pollster的不同日期结果变化。另外还有一种pollster是专门只做一两个州的,也很有意思。
回头说怎么看“白人无大学学位男性这个voting block 取样不够”这个2016的问题。也就是楼主的问题。 现在的pollster为了弥补这一条费劲了脑筋。- 这里有两种观点,一种认为是的取样不够,低估这个voting block的turnout。 一种认为是shy Trump voter. 也就是所谓的“口是心非”。 所以现在的pollster非常重视这个voting block。
-比如问“你邻居选谁?” 这样来排除噪音。这个办法在Trump supporter越来越响亮招摇后,越来越不好用了,想必大家有所体会。 于是现在甚至会问“你2016年选了谁?”“你2018年中期选举选了谁?”来排除。 比如现在已知某州白人无学位男性2012X投了O8. 2016 Y%投Trump, 2018 Z%投了GOP候选人。那么2020年我取样的时候会筛选出来相应的比例的回答了这个问题的被调查对象,考虑他们的答案。这样来“搭建”,而不是纯粹的把所有人都一模一样的算进去。一般来说撒谎自己过去选谁的人很少。。。
-横向比较。 每一个州都不是独立的。 比如西佛吉尼亚,是红的不能更红的Trump州。在这里做调查,“shy Trump voter"的可能性很低。对比2016的结果和2020的结果,如果Trump的support掉了,那么就的确是真的掉了。一般来说shift的比例在临近的州的相同block会差不多。【Hint: PA】
-对turnout的估计 最难估计的就是早票占比少的州的turnout形式 IL早票开的很早。虽然IL是深蓝州。但是IL的乡下人民的turnout和隔壁中西部州的turnout相比往年趋势区别不会太大(也要考虑是否有大麻,州长这样的议题) 维吉尼亚早票也是开的很早,其中的county by county的趋势也可以推论隔壁几个州的趋势。 佐治亚的黑人大波出动投票,也可以推论到Southern的黑人投票率会增高。 所以早票开始之后,民调会修正估计值,民调会越来越接近真实情况。
-有些州的独特县 比如AZ 一个Maricopa county占了60%+的选票。你可以就盯准一个地方用力研究,深入调查。很多private雇来pollster的就是深耕一两个地方。一些注册选民,当地的基层党组织对你已经很了解了,撒谎其实效果不大,更何况大部分人不撒谎= = 其他的摇摆州也有“重点县”,未必是因为“人数多”,而是这个县要么站在了整个州的政治光谱的中间,要么是有一个对两边至关重要的voting block. 比如MI的Wayne County,PA 的Erie,FL 的Sumter 等等。 FL的Sumter就是大名鼎鼎的the Villages 退休村。这里的老人很大程度代表了FL重要voting block - seniors。打个比方,如果估计GOP需要赢FL 60%老人票,但是发现只有55%的老人票拿到了,那么就大事不好了,必须调整策略。
最后说一句 看poll不如看钱看竞选团队在向什么地方跑 看一看两边的阵营的钱在向什么地方花。他们看到的是我们看不到的精确poll,可以得到基层党组织的汇报。这个动向更为准确。
而且不同媒体受众不一样,也存在误差。
但任何民调差两位数10%以上都是相差悬殊。
引用一下,撒谎不以为耻反以为荣。
Re.
羡慕吧,没人打给你,还没听说过打越洋电话搞民调的。
查不出来
你这人天天在这搅浑水有意思吗?理性讨论四个字你是哪个没看明白?
人家孩子诚心问个问题,咱么做长辈的就别吵吵了。知道的就回答下,不知道的就看看别人怎么说。
我看有些民调的样本也就1000人啊。真心不算大!
poll不准,我觉得好理解。 google search 可以预测结果是说的什么?检索两个候选人的次数吗?
你是说我很老吗?怎么我就成长辈啦? 我不是亲身经历回答了吗?就有我这样的逗他们乱说的。看心情。 要防肯定防不住,嘴巴在我身上啊。 但是,民调的可以想办法啊。比如,设计问题的时候下套。有人乱讲,他前后矛盾,你就知道这个不能用。再比如,打一万个电话,肯定比一千个靠谱。一两个乱讲的被冲淡了啊。
他前后矛盾,你就知道这个不能用
这倒是个好方法!民调公司实际上是这么操作的吗? 还是你感觉应该是这样?
大数据呗,有什么奇怪的。现在的大数据就是直接把整个population 的分布准确的算给你,那个poll还是在用几百最多不过千人的可能撒谎的数据去估算整个population的分布,你觉得后者能准吗?更何况后者还有那么多人为因素和社会政治背景。
我不是搞民调的,不知道。 不过,这个应该是明显的吧。比如小屁孩撒谎,叔叔阿姨盘问起来,不就是这样抓他们的吗。
两个候选人,搜索谁的次数多,谁赢的概率就大吗?
感觉这种不算大数据分析吧。这也太糙了点吧。
可以再加上demographic的weight。model从来都不是这么简单粗暴的。 还有预测选举绝对不能只看一个poll,像538那样总结poll的网站还稍微好一点。做决策需要看多种数据。
我没有说搜索谁的次数多谁就赢,这是你说的,我只是解释了一下为什么有人说的google search预测的准的原因。至于google search的预测怎么做的,肯定后面一堆人啊在弄啊。谁搜索次数多谁就赢确实是太糙了点,属于非常失败的数据分析……
刚来读大学。以前多在知乎国内网站玩。算是华人新鲜人,还好还好,没有吓倒。 在版上,学到了好多美国的知识。
我去图书馆找找这本书,谢谢推荐!
你说的这个方法倒是挺有说服力的。很想看看这种调查表,从来没收到过呢。
所以有margin of error 这个东西, 16年以后, 各民调机构都把无大学学位的选民权重加很多, 说不定这次选举的民调都调过头了
这个不一定。前提是撒谎的人和人口数是不成比例的才行。如果是成比例的,数量大也没用吧。
今天的新闻,给你参考下,民调确实有些问题,不能全信。
Biden campaign manager says national poll numbers are 'inflated'
https://www.theblaze.com/news/biden-polls-inflated-campaign-manager
The campaign manager for Joe Biden's presidential campaign warned that the national poll numbers were "inflated" and that their internal polls showed the race to be much closer than is being reported.
民调调查者猫腻的目的是什么? 为了最后证明自己不准吗? 感觉说不过去。又不是之前预测出什么倾向,对他们有好处似的。
这要看是谁了。民调可以是工具,用来影响选情的。这里的操作空间太大了。 大家都说2016的不准,我问你,哪家不准哪家准,你百分之百不记得。 这些都是四年不开张,开张吃四年的。懂吗?
现在这种情况下还真说不好会不会被。。。
感觉说不过去。你有意误导A赢,可能会激发B的支持者投票啊。很容易自己搞得复杂,backfire啊。
但是也可能让对方气馁放弃啊。 所以这些才都是有一帮人马在操作的啊。
写完了 楼主如果感兴趣 其实讲这些的书和资料蛮多的 挺有意思的
还有不到20天就可以揭晓迷底 拭目以待
有些党派的internal poll会调查自己靠得住的人的
不是完全随便撒网
不要再看YouTube Twitter的留言回复 赞踩 流量这些标准 来得出结论了
1 今年是re-election 所以流量本身不会均衡 2 保守派这边在AZ搞了个online troll farm 搜一搜新闻 他们公开承认的 主攻FB YouTube 3 同样,民主党也在自己的阵地,主要是Twitter上各种舆论战 4 那么哪边网上舆论战搞得更火呢?因为竞选资金是必须公开流向的,目前GOP在online花的钱远超过DEM。当然花钱最后的效果咱就不知道了。
喜欢诗吗?
赞啊,干货满满!
接受民调的人即便在2016之前也不高,记得差不多10%
你是否“挂断电话”实际上也是一个参数,代表选民的兴趣。
每家民调对于自己的这个参数是会参考的。
并不是所有pollster都是“左派混蛋“,还有GOP internal poll呢 :)
比如说 预计某个voting block是pro某党的。 从前打电话过去,一般10%的人愿意回答问题。 突然现在15%的人愿意回答问题啦~ 一般来说代表这个voting-block对自己的candidate的confidence上升了。
所以说不要觉得 挂断电话 = pollster 无计可施 挂断电话也是一个action. Every action has its meaning.
没明白这种测试为什么。这不很容易误导结果吗? 本来选A,硬币反应出的选B, 很多人自然就选B了啊。
是呢,我也觉得这样。
哇,真麻烦你写了这么多,真是太谢谢了。我对美国政治选举知道的不多,你写的这些我需要好好消化下,有些地方还看不懂说的什么。我连turnout的具体意思都不是很打包票自己理解清楚了呢。还有好多问题,比如“早票开始之后,民调会修正估计值”怎么能这么操作呢。好些问题,等我消化下,再请教您。
这个新闻显然是Biden团队怕他家选民误会自己已经躺赢,激励每个人都出来投票。
我最近被poll了,问的问题不多,先问的是我们州的几个candidate,最后才问了句总统会投谁。
我觉得挂断电话也不是很准耶,像我们接到这种电话直接就挂断,一是英文不好听不懂,二是和自己也没什么关系。对方怎么能判断出我是因为这些原因挂掉的呢。
是先从问你州里候选人的倾向上,感觉你在大选投谁这个问题上,一致不一致吗?
歪叔请放过,我们真还小。
不过今年看版上的讨论,很多人都是总统选一个党的,其余的选另外一个党的,不知道会不会误导了民调呢。
但是在蓝色恐怖之下, 你还能怎么办?
我还注册为民主党哪, 因为如果注册为共和党, 你就收不到选票。
谢谢分享,学习了。
有好几个5千多人的poll
和我看到的几篇文章差不多。16年其实没差很多,fbi是最后一脚踢下了希拉里。18年没有太多的惊喜,就准了。 poll没用,要看多少人出来投票。16年明显的民主党turnout不行。
😂,你是真没看懂啊。做调查的人又看不见被调查者的硬币结果,所以被调查者可以不需要担心任何后果的说出自己内心的真实想法,因为不管是什么,是”天意”,所以不存在透露自己政治倾向的问题,等于保护了自己的privacy。
不过如果真的问到像你这样的被调查者也是白搭😅,当然了,这只是一个理论,并没有真的用在实践中。
现实中的简单粗暴版就是问,你觉得你的邻居会选谁?
你说的这些把我也搞糊涂了,搞这么个硬币的point是什么?
邻居那个,更直接,很好明白。
很简单啊,在不透露自己政治倾向的前提下给出准确答案啊,这个很难理解吗?
政治倾向是一种隐私,某种意义上来说。
可能吧,我对政治不关心,这次是入籍以后第一次投票。所以本州的几个候选人大部分都不知道。我注册的是independent。
这个在我们州行不通,只能投注册党内的
梅姐太厉害了~~手工点赞~~
对哦,川普没钱买电视广告,只好网上买水军, 主力是油管facebook,随便漏一点,就足够把华人网颠覆了。
扯这么长也没用。16年Trump 在宾州赢了四万多张票,现在宾州民调显示拜登领先。但是大选前宾州新注册共和党选民增加了20万,你觉得这20万人会投票给谁呢?同时民主党注册选民下降了几万。其他几个摇摆州也是一样的情况。在政治正确的风气下,谁敢说真话?一个老太太给我说她不敢在院子里插Trump 的牌子因为她年纪大了,无法经受一些人疯狂的攻击,所以她把牌子插在屋里。
且不说Trump 拉力场场人山人海,各种自发的汽车摩托车游艇场面壮观,就说我自己经历的很小的一件事吧。我看到Target 把川普和拜登做成搞笑的玩偶在卖,过几天再去发现trump 的卖完了,一个不剩,只有一堆拜登孤零零站在货架上。附近一个小区邻居在next door说自家院子Biden 的牌子被偷了,提醒附近居民小心,说自己报了警。平时美国人丢猫丢狗丢钥匙的,回复都是一堆;这个post 唯一一条回复是“ 你不该去找警察,你应该找social worker” 简直笑死人。
党国就不要研究美国问题了,真心的,党国永远也不会知道有个东西叫民意,因为他们不在乎不需要这个东西。
你这不成了整个都是random了。应该是head就按照真实作答,tail就再扔硬币随机一个吧。 https://m.wikipedia.org/wiki/Randomized_response" target="_blank">https://en.https://m.wikipedia.org/wiki/Randomized_response
不过我感觉这种对于选举可能不太合适,因为一个A的坚定支持者可能压根不愿意回答是B,所以即使随机出了B,ta 也可能会说A,所以这问题又回到哪边的支持者更容易诚实作答了。
我说了这是一个理论,不是真的用于民调……主要说differential privacy,用民调打个比方
民调也知道自己不准。能怎么办?假设民调现在显示Trump领先,这个大选还有什么好选的。民调好歹现在还能用来造势是吧,所有媒体言论控制到这个地步,却相信民调是不偏不倚,当谁是傻子吗?
哈哈其实我也主要是想说你对randomized response的描述不太准确。 剩下的那部分主要是因为我自己前两天在想differential privacy能不能用于大选这类的民调。
你这个是回复我的吗?我没说啥相不相信民调准确的事呀……
敢插Trump 牌子的真是有勇气的
The home of Deana and Dennis Molla's home in Minnesota on fire A suspicious fire destroyed a detached garage and three cars at a Minnesota home that had a large “Trump 2020” presidential campaign sign outside, police said.
Feds investigating suspicious fire at Brooklyn Center home with 'Trump 2020' sign By Courtney Godfrey and Allie Johnson Published September 23