纯科学讨论,民调机构怎么确保接受民调的人不撒谎呢?

公用马甲3
楼主 (北美华人网)
真不是劝人贴,我是去年夏天才来美国留学的,心态上还算是中国人,是在美国的“外国留学生”,这次美国总统大选版上前辈们的讨论一直跟了,学到了好多美国的选举知识和政治知识,真是很有收获。除了吵架骂人的,真看得头疼。这个就不说了。
我就是想请教个问题,现在这民调那民调的天天出数据,那民调机构怎么确保接受民调的人不撒谎呢?比如AB两个竞选人,明明自己支持A,但告诉民调机构自己选B,这种情况会发生吗?民调机构又是怎么能把这种误导数据的因素排除的呢?
再强调一遍,我不占任何一方,不带风向,版上吵得大衣都不敢上,怕被骂,怕被查历史,咱就是纯科学请教啊!
最后预祝贵国总统大选顺利完成,祝愿美国大选后两党和各自的支持者能团结起来,社会也和谐起来。我去过新西兰,澳大利亚好些国家, 真心说,美国还是挺好的一个国家的,但天天这么吵吵真让人头大啊。

最新回帖

Namama
182 楼
这真的挺怪的,一般人撒谎造谣至少还有点不好意思,但是川粉真是不觉得有什么羞耻的,这是我最不理解的地方
rosesavels 发表于 2020-10-18 12:42

川粉从来都不要脸,整天就是撒谎造谣+传播fake news。。。

gaoyouli
181 楼
前一阵看到的研究说是选Trump的人被poll时撒谎的机率是选Biden的人撒谎机率的两倍。这种参数在做调查时也是会被考虑进去的。 撒谎的人不用那么洋洋自得。
hubaobao80
180 楼
梅干菜mm讲的太干货了,华人就应该多一点这种科学讨论。就这个贴里还有人说我自己周围看到怎么怎么样,这种只看自己周围可能有很大bias的sampling都不愿意看看科学sampling方法的,真的是反智。
yangzhu165 发表于 2020-10-19 01:27

完全是不同的认知程度,希望这次的事情也是全民科普的一个好机会。 隔壁还有非要重症科医生讲防疫知识的。人家都说了防疫方面和大家知道的差不多,疾病传播要看流行病的统计,重症治疗会因为患者的病情千差万别,普通人也没办法借鉴。
stacych8008
美国人average来说比较诚实,说出自己的选票倾向又不会被?
proserpina
You can't.



公用马甲3
美国人average来说比较诚实?
stacych8008 发表于 2020-10-17 16:32

感觉不会只靠人的诚实吧,没有更科学的解释吗?
公用马甲3
You can''t.




proserpina 发表于 2020-10-17 16:33

民调结果怎么查呢? 如果你说的和你最后投的不一致,这怎么能查出来? 还有接受民调,有填表费或者小礼物奉上吗?还是?
rosesavels
应该是没办法的。经常有川粉得意洋洋的说自己在电话poll的时候告诉别人自己会投拜登,所以我相信他们会有一个adjust这种欺骗性质回答的方案的
xiaomaoma
回复 1楼公用马甲3的帖子
是小留吗? 版上叔叔阿姨那种吵架气势没吓着吧?
lovejake
一般不会撒谎,但是会拒绝接受调查。
badgerbadger
一般人没这么无聊。 尤其网上的survey,不用和真人语音,更没什么可尴尬的。倒是phone poll,有些人因为感觉羞耻可能会撒谎(shy voter)。 non-response的问题反而比撒谎更严重,这些都需要model做调试。 然后这些误差在解读poll的时候也是要考虑到的。 学过统计的话,我们知道,数字只是数字而已,这个数字是怎么获取的,后面做了什么调整,多大误差,这都是必须要好好考虑再作结论的。
a
akara1101
回复 5楼公用马甲3的帖子
也许以前的民调还有一定参考价值,现在横空出现一个大bug叫政治正确,并且在此问题上犯过错误的人,真的会丢掉工作,被人鄙视,唾弃等等后,民调的真实性就没有办法再保证了。现在民调的目的已经不是准确预测结果了,而是配合引导舆论和可能出现的其他问题作掩饰。
w
wenhaoduoduo
大概是统计学上的概率问题吧,要说谎两边说谎的概率是一样的
awesomeiris
觉得接受民调的都是希望表达自己想法的人,自然大概率说的是实话。不接受民调的就是为了不用说谎或者还没有确定。总之没人逼着大家一定要接受民调,所以也没必要撒谎。
septemberfall
本人就被打过数次电话。选票已经寄出去了,全部共和党。我有心情的时候,他们问我,我都是回答选民主党。逗他们呢。
humanzh
回复 1楼公用马甲3的帖子
小刘别怕,这个问题挺好的,其实老刘我也有这个困惑呢。
humanzh
美国人average来说比较诚实,说出自己的选票倾向又不会被?
stacych8008 发表于 2020-10-17 16:32

我直觉现在不是这样的,肯定会有人故意反着说。占多大比例,不清楚。其实楼主小刘这个问题真挺好的,我也一直搞不清楚。
humanzh
民调结果怎么查呢? 如果你说的和你最后投的不一致,这怎么能查出来? 还有接受民调,有填表费或者小礼物奉上吗?还是?
公用马甲3 发表于 2020-10-17 16:34

这个倒是可以告诉你,查不出来,个人投的票都是高度隐私的,民调机构拿不到结果的。
填表费也是没有的。
humanzh
大概是统计学上的概率问题吧,要说谎两边说谎的概率是一样的
wenhaoduoduo 发表于 2020-10-17 16:43

我没有数据,但我觉得概率不会一样,社会气氛,对民调机构的态度等等,都会导致撒谎的比例不同。
lovejake
回复 5楼公用马甲3的帖子
也许以前的民调还有一定参考价值,现在横空出现一个大bug叫政治正确,并且在此问题上犯过错误的人,真的会丢掉工作,被人鄙视,唾弃等等后,民调的真实性就没有办法再保证了。现在民调的目的已经不是准确预测结果了,而是配合引导舆论和可能出现的其他问题作掩饰。
akara1101 发表于 2020-10-17 16:42

对,尤其在大公司工作的人,绝对不会暴露自己的政治倾向
热血热胜红日光
回复 1楼公用马甲3的帖子
是小留吗? 版上叔叔阿姨那种吵架气势没吓着吧?
xiaomaoma 发表于 2020-10-17 16:39

我觉得叔叔吵架的不多,吵架的多是阿姨们么。五毛除外哈
梅干茶泡饭
有很多办法 一会我回来写 回来了 我写一些 事先声明我不是pollster 但是的确对这些比较感兴趣 贡献下自己的“一知半解”吧
首先强调下pollster里,不是所有的都是political的,很多做的是商业的poll. 打个比方,某时尚公司想知道大家想要什么颜色的包包,于是hire一个外界pollster来调查一下大家的喜好, 决定明年做什么包包。这样更常见。这是一个非常大的industry.
political poll里,大家在电视上看到的是都是免费向民众公布的public的poll,也就是常见的YouGov, Emerson, Quinnipiac等结果。实际上竞选团队和一些利益相关的机构(比如股市相关的)会去花钱买private的poll, 比如Kellyanne Conway就是做pollster起家,她的Twitter账号就叫@KellyannePolls。这些private 的poll更有针对性,通常更为准确尖锐,但是你不会在电视上看到。
民众看Poll关心的是谁会赢。而竞选团队关注的是如果制定策略,下一步还有那些人可以争取,资源怎么分配。
毕竟美国的制度在绝大部分州是赢者通吃。
希拉里是资源分配的大输家,用在AZ等地的资源稍微倾斜一下Blue Wall结果就会大不相同。实际上她“辛勤耕耘”“开动马力”的主攻的地方取得的成绩是不错的,比如NH这样很难赢的州。 而Trump在Kellyanne的精准民调指挥下,精准的把更少的资源投放在关键的地方,在WI MI PA都是<1%的差距赢下整个州。可以说是世纪经典了。
下面只说大家能看到的public poll
然后说一下2016年的poll到底出了什么问题。 实际上2016年的poll最后并没有错得“离谱”,主要问题集中在Blue Wall也就是现在说的中西部摇摆州。 这里有两个原因, 1 由于投票规则原因,中西部州大选日投票占比例极高,收到FBI bomb的影响最大。每一个poll都需要时间conduct,最后几天来不及了。 2 白人无大学学位男性这个voting block 取样不够。
第一个问题从pollster角度无法避免。第二个问题pollster现在都在拼命“矫正”。
大家现在会看到不同的poll出来的结果不同,原因主要在取样方式上。 如果我可以调查所有德州选民,那么我的预测肯定是最准确的,但是这不可能操作。 如果我取样里90%是奥斯丁居民,10%是红脖子,那肯定Biden躺赢了。反过来也肯定Trump躺赢:)
每个pollster的model都是不一样的。 一般来说会考虑到这个州的投票传统 比如 1 选民比例- 看一下此州的GOP:DEM:Independent选民注册比例。 (有些州并不按照party注册但是可以预计) 2 选民投票热情 (turnout) 3 也有很多其他参数 一般来说很多摇摆州 GOP注册选民少于DEM,而GOP选民的turnout高于DEM。(老头老太turnout最高,年轻人turnout最低)。GOP选民的turnout热情的区间跨越小很稳定。DEM选民的turnout却是过山车,有时倾巢而出,有时不肯出来。 所以很多model会给GOP取样这边提高一点weight来计算结果。
因为取样model的不同。pollster也会有“左右”之分。有的更偏左,有的偏右。有些pollster甚至是GOP/DEM internal. -这种pollster并不是"中立“的,而是和党派合作的,通常会非常pro这个党派。所以说如果这种internal poll都崩了,那就真的崩了。。。 所以看趋势的时候不妨多看看同一个pollster的不同日期结果变化。另外还有一种pollster是专门只做一两个州的,也很有意思。
回头说怎么看“白人无大学学位男性这个voting block 取样不够”这个2016的问题。也就是楼主的问题。 现在的pollster为了弥补这一条费劲了脑筋。- 这里有两种观点,一种认为是的取样不够,低估这个voting block的turnout。 一种认为是shy Trump voter. 也就是所谓的“口是心非”。 所以现在的pollster非常重视这个voting block。
-比如问“你邻居选谁?” 这样来排除噪音。这个办法在Trump supporter越来越响亮招摇后,越来越不好用了,想必大家有所体会。 于是现在甚至会问“你2016年选了谁?”“你2018年中期选举选了谁?”来排除。 比如现在已知某州白人无学位男性2012X投了O8. 2016 Y%投Trump, 2018 Z%投了GOP候选人。那么2020年我取样的时候会筛选出来相应的比例的回答了这个问题的被调查对象,考虑他们的答案。这样来“搭建”,而不是纯粹的把所有人都一模一样的算进去。一般来说撒谎自己过去选谁的人很少。。。
-横向比较。 每一个州都不是独立的。 比如西佛吉尼亚,是红的不能更红的Trump州。在这里做调查,“shy Trump voter"的可能性很低。对比2016的结果和2020的结果,如果Trump的support掉了,那么就的确是真的掉了。一般来说shift的比例在临近的州的相同block会差不多。【Hint: PA】
-对turnout的估计 最难估计的就是早票占比少的州的turnout形式 IL早票开的很早。虽然IL是深蓝州。但是IL的乡下人民的turnout和隔壁中西部州的turnout相比往年趋势区别不会太大(也要考虑是否有大麻,州长这样的议题) 维吉尼亚早票也是开的很早,其中的county by county的趋势也可以推论隔壁几个州的趋势。 佐治亚的黑人大波出动投票,也可以推论到Southern的黑人投票率会增高。 所以早票开始之后,民调会修正估计值,民调会越来越接近真实情况。
-有些州的独特县 比如AZ 一个Maricopa county占了60%+的选票。你可以就盯准一个地方用力研究,深入调查。很多private雇来pollster的就是深耕一两个地方。一些注册选民,当地的基层党组织对你已经很了解了,撒谎其实效果不大,更何况大部分人不撒谎= = 其他的摇摆州也有“重点县”,未必是因为“人数多”,而是这个县要么站在了整个州的政治光谱的中间,要么是有一个对两边至关重要的voting block. 比如MI的Wayne County,PA 的Erie,FL 的Sumter 等等。 FL的Sumter就是大名鼎鼎的the Villages 退休村。这里的老人很大程度代表了FL重要voting block - seniors。打个比方,如果估计GOP需要赢FL 60%老人票,但是发现只有55%的老人票拿到了,那么就大事不好了,必须调整策略。
最后说一句 看poll不如看钱看竞选团队在向什么地方跑 看一看两边的阵营的钱在向什么地方花。他们看到的是我们看不到的精确poll,可以得到基层党组织的汇报。这个动向更为准确。
还是太胖胖
确保民调人群的多样性就行,如果民调集中在某特点人群,说不说谎最后结果都会大误差;人群多样,说谎的影响也降低了
liucoan
版上就没有在民调机构工作的吗? 应该有吧,也想听听是怎么排除这种情况或者干扰的。
badgerbadger
稍微有点偏题,但是科普一下: 16年的民调也在误差范围之内,偏离得有点远主要是因为民调模型没有反映出受教育程度对选民的影响。因为两党之前几十年一直没有因为受教育程度的影响造成特别大的变动。他们改变模型之后,2018年中期选举的预测都是非常准确的。
feifeiduan
不能,所以民调有+-5%的误差,都在正常范围内。
而且不同媒体受众不一样,也存在误差。
但任何民调差两位数10%以上都是相差悬殊。
rosesavels
本人就被打过数次电话。选票已经寄出去了,全部共和党。我有心情的时候,他们问我,我都是回答选民主党。逗他们呢。
septemberfall 发表于 2020-10-17 16:44

引用一下,撒谎不以为耻反以为荣。
a
apple44
肯定有人在做民调的时候撒谎啊! 比如2016年众多民调失败,大家总结分析原因,其中之一就是怀疑很多人在被别人问到的时候不好意思说支持Trump,毕竟自己也知道他不是啥好人,于是说支持另一方。但投票的时候却会投Trump. 当然了这只是大家猜想的,没有办法证实。 另外民调和民调差多了。我有一回接到一个民调电话,问关于本州内的选举和其他问题。其中一个问题是:你是pro-life, 还是pro-abortion? 我一听,肯定是共和党搞的民调,怎么会有人Pro-abortion? 那叫Pro-choice好吧?Pro-abortion 听起来就是闲着没事儿就要堕胎,那不有病吗?Pro-Life的反面是Pro-choice,提供选择而已。我立刻就说,我既不是Pro-life, 也不是pro-abortion!但没有别的选项,只能在两个当中选一个。我说那你们的民调设计的太差,我不参加了,就挂了电话。
proserpina
对,尤其在大公司工作的人,绝对不会暴露自己的政治倾向
lovejake 发表于 2020-10-17 16:50

Re.
苹果绿
撒谎的人极少,但拒绝参加survey的很多,而拒绝参加的都属于沉默的大多数
septemberfall
引用一下,撒谎不以为耻反以为荣。
rosesavels 发表于 2020-10-17 16:56

羡慕吧,没人打给你,还没听说过打越洋电话搞民调的。
proserpina
民调结果怎么查呢? 如果你说的和你最后投的不一致,这怎么能查出来? 还有接受民调,有填表费或者小礼物奉上吗?还是?
公用马甲3 发表于 2020-10-17 16:34

查不出来
badgerbadger
羡慕吧,没人打给你,还没听说过打越洋电话搞民调的。
septemberfall 发表于 2020-10-17 16:58

你这人天天在这搅浑水有意思吗?理性讨论四个字你是哪个没看明白?
xiaomaoma
羡慕吧,没人打给你,还没听说过打越洋电话搞民调的。
septemberfall 发表于 2020-10-17 16:58

人家孩子诚心问个问题,咱么做长辈的就别吵吵了。知道的就回答下,不知道的就看看别人怎么说。
三省吾身
很难确保,2016年的时候poll就不准确。 推荐一本书:Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are 这里解释了2016年为啥poll不准确,但是google search可以预测结果
Anna8711
样本大 regression to the mean
xiaomaoma
样本大 regression to the mean
Anna8711 发表于 2020-10-17 17:06

我看有些民调的样本也就1000人啊。真心不算大!
liucoan
很难确保,2016年的时候poll就不准确。 推荐一本书:Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are 这里解释了2016年为啥poll不准确,但是google search可以预测结果
三省吾身 发表于 2020-10-17 17:05

poll不准,我觉得好理解。 google search 可以预测结果是说的什么?检索两个候选人的次数吗?
septemberfall
人家孩子诚心问个问题,咱么做长辈的就别吵吵了。知道的就回答下,不知道的就看看别人怎么说。
xiaomaoma 发表于 2020-10-17 17:03

你是说我很老吗?怎么我就成长辈啦? 我不是亲身经历回答了吗?就有我这样的逗他们乱说的。看心情。 要防肯定防不住,嘴巴在我身上啊。 但是,民调的可以想办法啊。比如,设计问题的时候下套。有人乱讲,他前后矛盾,你就知道这个不能用。再比如,打一万个电话,肯定比一千个靠谱。一两个乱讲的被冲淡了啊。
liucoan
你是说我很老吗?怎么我就成长辈啦? 我不是亲身经历回答了吗?就有我这样的逗他们乱说的。看心情。 要防肯定防不住,嘴巴在我身上啊。 但是,民调的可以想办法啊。比如,设计问题的时候下套。有人乱讲,他前后矛盾,你就知道这个不能用。再比如,打一万个电话,肯定比一千个靠谱。一两个乱讲的被冲淡了啊。
septemberfall 发表于 2020-10-17 17:08

他前后矛盾,你就知道这个不能用
这倒是个好方法!民调公司实际上是这么操作的吗? 还是你感觉应该是这样?
a
akara1101
poll不准,我觉得好理解。 google search 可以预测结果是说的什么?检索两个候选人的次数吗?
liucoan 发表于 2020-10-17 17:08

大数据呗,有什么奇怪的。现在的大数据就是直接把整个population 的分布准确的算给你,那个poll还是在用几百最多不过千人的可能撒谎的数据去估算整个population的分布,你觉得后者能准吗?更何况后者还有那么多人为因素和社会政治背景。
Anna8711
调查的sample会根据调查人的biography 在population中调整weight, 另外民调挺频繁的 如果model不robust应该差距会很大 16年其实poll是准的 只是turnout低了 popular赢了也没用
septemberfall
他前后矛盾,你就知道这个不能用
这倒是个好方法!民调公司实际上是这么操作的吗? 还是你感觉应该是这样?
liucoan 发表于 2020-10-17 17:12

我不是搞民调的,不知道。 不过,这个应该是明显的吧。比如小屁孩撒谎,叔叔阿姨盘问起来,不就是这样抓他们的吗。
yaeryiyi
大数据呗,有什么奇怪的。现在的大数据就是直接把整个population 的分布准确的算给你,那个poll还是在用几百最多不过千人的可能撒谎的数据去估算整个population的分布,你觉得后者能准吗?更何况后者还有那么多人为因素和社会政治背景。
akara1101 发表于 2020-10-17 17:14

两个候选人,搜索谁的次数多,谁赢的概率就大吗?
感觉这种不算大数据分析吧。这也太糙了点吧。
badgerbadger
两个候选人,搜索谁的次数多,谁赢的概率就大吗?
感觉这种不算大数据分析吧。这也太糙了点吧。
yaeryiyi 发表于 2020-10-17 17:17

可以再加上demographic的weight。model从来都不是这么简单粗暴的。 还有预测选举绝对不能只看一个poll,像538那样总结poll的网站还稍微好一点。做决策需要看多种数据。
a
akara1101
两个候选人,搜索谁的次数多,谁赢的概率就大吗?
感觉这种不算大数据分析吧。这也太糙了点吧。
yaeryiyi 发表于 2020-10-17 17:17

我没有说搜索谁的次数多谁就赢,这是你说的,我只是解释了一下为什么有人说的google search预测的准的原因。至于google search的预测怎么做的,肯定后面一堆人啊在弄啊。谁搜索次数多谁就赢确实是太糙了点,属于非常失败的数据分析……
公用马甲3
回复 1楼公用马甲3的帖子
是小留吗? 版上叔叔阿姨那种吵架气势没吓着吧?
xiaomaoma 发表于 2020-10-17 16:39

刚来读大学。以前多在知乎国内网站玩。算是华人新鲜人,还好还好,没有吓倒。 在版上,学到了好多美国的知识。
公用马甲3
很难确保,2016年的时候poll就不准确。 推荐一本书:Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are 这里解释了2016年为啥poll不准确,但是google search可以预测结果
三省吾身 发表于 2020-10-17 17:05

我去图书馆找找这本书,谢谢推荐!
公用马甲3
你是说我很老吗?怎么我就成长辈啦? 我不是亲身经历回答了吗?就有我这样的逗他们乱说的。看心情。 要防肯定防不住,嘴巴在我身上啊。 但是,民调的可以想办法啊。比如,设计问题的时候下套。有人乱讲,他前后矛盾,你就知道这个不能用。再比如,打一万个电话,肯定比一千个靠谱。一两个乱讲的被冲淡了啊。
septemberfall 发表于 2020-10-17 17:08

你说的这个方法倒是挺有说服力的。很想看看这种调查表,从来没收到过呢。
a
akara1101
说个好玩的,避免民调的误差也有一些办法,有人设计出这样一种办法,给打电话接受民调的人说,请拿出一枚硬币,如果掷出head就是意味着白等赢,如果掷出tail就是意味着川普赢。好了,现在请告诉我你掷出的是head还是tail呢?这就叫differential privacy.
FTrumptards
美国人average来说比较诚实,说出自己的选票倾向又不会被?
stacych8008 发表于 2020-10-17 16:32

所以有margin of error 这个东西, 16年以后, 各民调机构都把无大学学位的选民权重加很多, 说不定这次选举的民调都调过头了
AaronBush
不需要保证,样本数量够大能稀释故意撒谎的人
understandu
不需要保证,样本数量够大能稀释故意撒谎的人
AaronBush 发表于 2020-10-17 17:38

这个不一定。前提是撒谎的人和人口数是不成比例的才行。如果是成比例的,数量大也没用吧。
M
MaggieC
这次大选结果出来了,就知道民调是咋回事了
yainju
回复 1楼公用马甲3的帖子
今天的新闻,给你参考下,民调确实有些问题,不能全信。
Biden campaign manager says national poll numbers are 'inflated'
https://www.theblaze.com/news/biden-polls-inflated-campaign-manager
The campaign manager for Joe Biden's presidential campaign warned that the national poll numbers were "inflated" and that their internal polls showed the race to be much closer than is being reported.
tpjames2020
相比于民调调查者的可能的猫腻,被调查者这种欺骗连噪音都谈不上。对结果没影响,影响结果的是取样是否随机。
真不是劝人贴,我是去年夏天才来美国留学的,心态上还算是中国人,是在美国的“外国留学生”,这次美国总统大选版上前辈们的讨论一直跟了,学到了好多美国的选举知识和政治知识,真是很有收获。除了吵架骂人的,真看得头疼。这个就不说了。我就是想请教个问题,现在这民调那民调的天天出数据,那民调机构怎么确保接受民调的人不撒谎呢?比如AB两个竞选人,明明自己支持A,但告诉民调机构自己选B,这种情况会发生吗?民调机构又是怎么能把这种误导数据的因素排除的呢?再强调一遍,我不占任何一方,不带风向,版上吵得大衣都不敢上,怕被骂,怕被查历史,咱就是纯科学请教啊!最后预祝贵国总统大选顺利完成,祝愿美国大选后两党和各自的支持者能团结起来,社会也和谐起来。我去过新西兰,澳大利亚好些国家, 真心说,美国还是挺好的一个国家的,但天天这么吵吵真让人头大啊。
公用马甲3 发表于 10/17/2020 4:30:53 PM
yainju
相比于民调调查者的可能的猫腻,被调查者这种欺骗连噪音都谈不上。对结果没影响,影响结果的是取样是否随机。
真不是劝人贴,我是去年夏天才来美国留学的,心态上还算是中国人,是在美国的“外国留学生”,这次美国总统大选版上前辈们的讨论一直跟了,学到了好多美国的选举知识和政治知识,真是很有收获。除了吵架骂人的,真看得头疼。这个就不说了。我就是想请教个问题,现在这民调那民调的天天出数据,那民调机构怎么确保接受民调的人不撒谎呢?比如AB两个竞选人,明明自己支持A,但告诉民调机构自己选B,这种情况会发生吗?民调机构又是怎么能把这种误导数据的因素排除的呢?再强调一遍,我不占任何一方,不带风向,版上吵得大衣都不敢上,怕被骂,怕被查历史,咱就是纯科学请教啊!最后预祝贵国总统大选顺利完成,祝愿美国大选后两党和各自的支持者能团结起来,社会也和谐起来。我去过新西兰,澳大利亚好些国家, 真心说,美国还是挺好的一个国家的,但天天这么吵吵真让人头大啊。
公用马甲3 发表于 10/17/2020 4:30:53 PM


tpjames2020 发表于 2020-10-17 17:46

民调调查者猫腻的目的是什么? 为了最后证明自己不准吗? 感觉说不过去。又不是之前预测出什么倾向,对他们有好处似的。
hijklmn
肯定有误差,就算不说谎也是有bias的。。。
公用马甲34
楼主居然才和我孩子一样大。突然觉得浑身不自在。
septemberfall
民调调查者猫腻的目的是什么? 为了最后证明自己不准吗? 感觉说不过去。又不是之前预测出什么倾向,对他们有好处似的。
yainju 发表于 2020-10-17 17:49

这要看是谁了。民调可以是工具,用来影响选情的。这里的操作空间太大了。 大家都说2016的不准,我问你,哪家不准哪家准,你百分之百不记得。 这些都是四年不开张,开张吃四年的。懂吗?
spicyshrimp
美国人average来说比较诚实,说出自己的选票倾向又不会被?
stacych8008 发表于 2020-10-17 16:32

现在这种情况下还真说不好会不会被。。。
yainju
这要看是谁了。民调可以是工具,用来影响选情的。这里的操作空间太大了。 大家都说2016的不准,我问你,哪家不准哪家准,你百分之百不记得。 这些都是四年不开张,开张吃四年的。懂吗?
septemberfall 发表于 2020-10-17 17:52

感觉说不过去。你有意误导A赢,可能会激发B的支持者投票啊。很容易自己搞得复杂,backfire啊。

septemberfall
感觉说不过去。你有意误导A赢,可能会激发B的支持者投票啊。很容易自己搞得复杂,backfire啊。


yainju 发表于 2020-10-17 17:55

但是也可能让对方气馁放弃啊。 所以这些才都是有一帮人马在操作的啊。
shoon_yee
那么多的垃圾电话,有多少人接电话,都是什么背景的人接电话,poll就不准了吧?
梅干茶泡饭
有很多办法 一会我回来写 回来了 我写一些 事先声明我不是pollster 但是的确对这些比较感兴趣 贡献下自己的“一知半解”吧
首先强调下pollster里,不是所有的都是political的,很多做的是商业的poll. 打个比方,某时尚公司想知道大家想要什么颜色的包包,于是hire一个外界pollster来调查一下大家的喜好, 决定明年做什么包包。这样更常见。这是一个非常大的industry.
political poll里,大家在电视上看到的是都是免费向民众公布的public的poll,也就是常见的YouGov, Emerson, Quinnipiac等结果。实际上竞选团队和一些利益相关的机构(比如股市相关的)会去花钱买private的poll, 比如Kellyanne Conway就是做pollster起家,她的Twitter账号就叫@KellyannePolls。这些private 的poll更有针对性,通常更为准确尖锐,但是你不会在电视上看到。
民众看Poll关心的是谁会赢。而竞选团队关注的是如果制定策略,下一步还有那些人可以争取,资源怎么分配。
毕竟美国的制度在绝大部分州是赢者通吃。
希拉里是资源分配的大输家,用在AZ等地的资源稍微倾斜一下Blue Wall结果就会大不相同。实际上她“辛勤耕耘”“开动马力”的主攻的地方取得的成绩是不错的,比如NH这样很难赢的州。 而Trump在Kellyanne的精准民调指挥下,精准的把更少的资源投放在关键的地方,在WI MI PA都是<1%的差距赢下整个州。可以说是世纪经典了。
下面只说大家能看到的public poll
然后说一下2016年的poll到底出了什么问题。 实际上2016年的poll最后并没有错得“离谱”,主要问题集中在Blue Wall也就是现在说的中西部摇摆州。 这里有两个原因, 1 由于投票规则原因,中西部州大选日投票占比例极高,收到FBI bomb的影响最大。每一个poll都需要时间conduct,最后几天来不及了。 2 白人无大学学位男性这个voting block 取样不够。
第一个问题从pollster角度无法避免。第二个问题pollster现在都在拼命“矫正”。
大家现在会看到不同的poll出来的结果不同,原因主要在取样方式上。 如果我可以调查所有德州选民,那么我的预测肯定是最准确的,但是这不可能操作。 如果我取样里90%是奥斯丁居民,10%是红脖子,那肯定Biden躺赢了。反过来也肯定Trump躺赢:)
每个pollster的model都是不一样的。 一般来说会考虑到这个州的投票传统 比如 1 选民比例- 看一下此州的GOP:DEM:Independent选民注册比例。 (有些州并不按照party注册但是可以预计) 2 选民投票热情 (turnout) 3 也有很多其他参数 一般来说很多摇摆州 GOP注册选民少于DEM,而GOP选民的turnout高于DEM。(老头老太turnout最高,年轻人turnout最低)。GOP选民的turnout热情的区间跨越小很稳定。DEM选民的turnout却是过山车,有时倾巢而出,有时不肯出来。 所以很多model会给GOP取样这边提高一点weight来计算结果。
因为取样model的不同。pollster也会有“左右”之分。有的更偏左,有的偏右。有些pollster甚至是GOP/DEM internal. -这种pollster并不是"中立“的,而是和党派合作的,通常会非常pro这个党派。所以说如果这种internal poll都崩了,那就真的崩了。。。 所以看趋势的时候不妨多看看同一个pollster的不同日期结果变化。另外还有一种pollster是专门只做一两个州的,也很有意思。
回头说怎么看“白人无大学学位男性这个voting block 取样不够”这个2016的问题。也就是楼主的问题。 现在的pollster为了弥补这一条费劲了脑筋。- 这里有两种观点,一种认为是的取样不够,低估这个voting block的turnout。 一种认为是shy Trump voter. 也就是所谓的“口是心非”。 所以现在的pollster非常重视这个voting block。
-比如问“你邻居选谁?” 这样来排除噪音。这个办法在Trump supporter越来越响亮招摇后,越来越不好用了,想必大家有所体会。 于是现在甚至会问“你2016年选了谁?”“你2018年中期选举选了谁?”来排除。 比如现在已知某州白人无学位男性2012X投了O8. 2016 Y%投Trump, 2018 Z%投了GOP候选人。那么2020年我取样的时候会筛选出来相应的比例的回答了这个问题的被调查对象,考虑他们的答案。这样来“搭建”,而不是纯粹的把所有人都一模一样的算进去。
-横向比较。 每一个州都不是独立的。 比如西佛吉尼亚,是红的不能更红的Trump州。在这里做调查,“shy Trump voter"的可能性很低。对比2016的结果和2020的结果,如果Trump的support掉了,那么就的确是真的掉了。一般来说shift的比例在临近的州的相同block会差不多。
-对turnout的估计 最难估计的就是早票占比少的州的turnout形式 IL早票开的很早。虽然IL是深蓝州。但是IL的乡下人民的turnout和隔壁中西部州的turnout相比往年趋势区别不会太大(也要考虑是否有大麻,州长这样的议题) 维吉尼亚早票也是开的很早,其中的county by county的趋势也可以推论隔壁几个州的趋势。 佐治亚的黑人大波出动投票,也可以推论到Southern的黑人投票率会增高。 所以早票开始之后,民调会修正估计值,民调会越来越接近真实情况。
-有些州的独特县 比如AZ 一个Maricopa county占了60%+的选票。你可以就盯准一个地方用力研究,深入调查。很多private雇来pollster的就是深耕一两个地方。一些注册选民,当地的基层党组织对你已经很了解了,撒谎其实效果不大,更何况大部分人不撒谎= = 其他的摇摆州也有“重点县”,未必是因为“人数多”,而是这个县要么站在了整个州的政治光谱的中间,要么是有一个对两边至关重要的voting block. 比如MI的Wayne County,PA 的Erie,FL 的Sumter 等等。 FL的Sumter就是大名鼎鼎的the Villages 退休村。这里的老人很大程度代表了FL重要voting block - seniors。打个比方,如果估计GOP需要赢FL 60%老人票,但是发现只有55%的老人票拿到了,那么就大事不好了,必须调整策略。
最后说一句 看poll不如看钱看竞选团队在向什么地方跑 看一看两边的阵营的钱在向什么地方花。他们看到的是我们看不到的精确poll,可以得到基层党组织的汇报。这个动向更为准确。
梅干茶泡饭 发表于 2020-10-17 16:51

写完了 楼主如果感兴趣 其实讲这些的书和资料蛮多的 挺有意思的
还有不到20天就可以揭晓迷底 拭目以待
梅干茶泡饭
那么多的垃圾电话,有多少人接电话,都是什么背景的人接电话,poll就不准了吧?

shoon_yee 发表于 2020-10-17 18:02

有些党派的internal poll会调查自己靠得住的人的
不是完全随便撒网
梅干茶泡饭
另外补充一句
不要再看YouTube Twitter的留言回复 赞踩 流量这些标准 来得出结论了
1 今年是re-election 所以流量本身不会均衡 2 保守派这边在AZ搞了个online troll farm 搜一搜新闻 他们公开承认的 主攻FB YouTube 3 同样,民主党也在自己的阵地,主要是Twitter上各种舆论战 4 那么哪边网上舆论战搞得更火呢?因为竞选资金是必须公开流向的,目前GOP在online花的钱远超过DEM。当然花钱最后的效果咱就不知道了。
pwwp
刚来读大学。以前多在知乎国内网站玩。算是华人新鲜人,还好还好,没有吓倒。 在版上,学到了好多美国的知识。
公用马甲3 发表于 2020-10-17 17:24

喜欢诗吗?
rosesavels
写完了 楼主如果感兴趣 其实讲这些的书和资料蛮多的 挺有意思的
还有不到20天就可以揭晓迷底 拭目以待
梅干茶泡饭 发表于 2020-10-17 18:11

赞啊,干货满满!
梅干茶泡饭
另外关于大家说的 “我一听到是民调就挂电话哼哼”这个问题
接受民调的人即便在2016之前也不高,记得差不多10%
你是否“挂断电话”实际上也是一个参数,代表选民的兴趣。
每家民调对于自己的这个参数是会参考的。
并不是所有pollster都是“左派混蛋“,还有GOP internal poll呢 :)
比如说 预计某个voting block是pro某党的。 从前打电话过去,一般10%的人愿意回答问题。 突然现在15%的人愿意回答问题啦~ 一般来说代表这个voting-block对自己的candidate的confidence上升了。
所以说不要觉得 挂断电话 = pollster 无计可施 挂断电话也是一个action. Every action has its meaning.
公用马甲3
说个好玩的,避免民调的误差也有一些办法,有人设计出这样一种办法,给打电话接受民调的人说,请拿出一枚硬币,如果掷出head就是意味着白等赢,如果掷出tail就是意味着川普赢。好了,现在请告诉我你掷出的是head还是tail呢?这就叫differential privacy.
akara1101 发表于 2020-10-17 17:33

没明白这种测试为什么。这不很容易误导结果吗? 本来选A,硬币反应出的选B, 很多人自然就选B了啊。
公用马甲3
这个不一定。前提是撒谎的人和人口数是不成比例的才行。如果是成比例的,数量大也没用吧。
understandu 发表于 2020-10-17 17:40

是呢,我也觉得这样。
xgq32
会有其他问题佐证你的倾向吧
公用马甲3
写完了 楼主如果感兴趣 其实讲这些的书和资料蛮多的 挺有意思的
还有不到20天就可以揭晓迷底 拭目以待
梅干茶泡饭 发表于 2020-10-17 18:11

哇,真麻烦你写了这么多,真是太谢谢了。我对美国政治选举知道的不多,你写的这些我需要好好消化下,有些地方还看不懂说的什么。我连turnout的具体意思都不是很打包票自己理解清楚了呢。还有好多问题,比如“早票开始之后,民调会修正估计值”怎么能这么操作呢。好些问题,等我消化下,再请教您。
ca563
回复 1楼公用马甲3的帖子
今天的新闻,给你参考下,民调确实有些问题,不能全信。
Biden campaign manager says national poll numbers are 'inflated'
https://www.theblaze.com/news/biden-polls-inflated-campaign-manager
The campaign manager for Joe Biden's presidential campaign warned that the national poll numbers were "inflated" and that their internal polls showed the race to be much closer than is being reported.
yainju 发表于 2020-10-17 17:45

这个新闻显然是Biden团队怕他家选民误会自己已经躺赢,激励每个人都出来投票。
我最近被poll了,问的问题不多,先问的是我们州的几个candidate,最后才问了句总统会投谁。
公用马甲3
另外关于大家说的 “我一听到是民调就挂电话哼哼”这个问题
接受民调的人即便在2016之前也不高,记得差不多10%
你是否“挂断电话”实际上也是一个参数,代表选民的兴趣。
每家民调对于自己的这个参数是会参考的。
并不是所有pollster都是“左派混蛋“,还有GOP internal poll呢 :)
比如说 预计某个voting block是pro某党的。 从前打电话过去,一般10%的人愿意回答问题。 突然现在15%的人愿意回答问题啦~ 一般来说代表这个voting-block对自己的candidate的confidence上升了。
所以说不要觉得 挂断电话 = pollster 无计可施 挂断电话也是一个action. Every action has its meaning.

梅干茶泡饭 发表于 2020-10-17 18:53

我觉得挂断电话也不是很准耶,像我们接到这种电话直接就挂断,一是英文不好听不懂,二是和自己也没什么关系。对方怎么能判断出我是因为这些原因挂掉的呢。
公用马甲3
这个新闻显然是Biden团队怕他家选民误会自己已经躺赢,激励每个人都出来投票。
我最近被poll了,问的问题不多,先问的是我们州的几个candidate,最后才问了句总统会投谁。
ca563 发表于 2020-10-17 19:25

是先从问你州里候选人的倾向上,感觉你在大选投谁这个问题上,一致不一致吗?
公用马甲3
喜欢诗吗?
pwwp 发表于 2020-10-17 18:22

歪叔请放过,我们真还小。
公用马甲3
会有其他问题佐证你的倾向吧
xgq32 发表于 2020-10-17 19:23

不过今年看版上的讨论,很多人都是总统选一个党的,其余的选另外一个党的,不知道会不会误导了民调呢。
qd1981
引用一下,撒谎不以为耻反以为荣。
rosesavels 发表于 2020-10-17 16:56

但是在蓝色恐怖之下, 你还能怎么办?
我还注册为民主党哪, 因为如果注册为共和党, 你就收不到选票。
m
majiaamajia
我从来只接我认识的人的电话,不认识的号码一律不接
alex20200731
有很多办法 一会我回来写 回来了 我写一些 事先声明我不是pollster 但是的确对这些比较感兴趣 贡献下自己的“一知半解”吧
首先强调下pollster里,不是所有的都是political的,很多做的是商业的poll. 打个比方,某时尚公司想知道大家想要什么颜色的包包,于是hire一个外界pollster来调查一下大家的喜好, 决定明年做什么包包。这样更常见。这是一个非常大的industry.
political poll里,大家在电视上看到的是都是免费向民众公布的public的poll,也就是常见的YouGov, Emerson, Quinnipiac等结果。实际上竞选团队和一些利益相关的机构(比如股市相关的)会去花钱买private的poll, 比如Kellyanne Conway就是做pollster起家,她的Twitter账号就叫@KellyannePolls。这些private 的poll更有针对性,通常更为准确尖锐,但是你不会在电视上看到。
民众看Poll关心的是谁会赢。而竞选团队关注的是如果制定策略,下一步还有那些人可以争取,资源怎么分配。
毕竟美国的制度在绝大部分州是赢者通吃。
希拉里是资源分配的大输家,用在AZ等地的资源稍微倾斜一下Blue Wall结果就会大不相同。实际上她“辛勤耕耘”“开动马力”的主攻的地方取得的成绩是不错的,比如NH这样很难赢的州。 而Trump在Kellyanne的精准民调指挥下,精准的把更少的资源投放在关键的地方,在WI MI PA都是<1%的差距赢下整个州。可以说是世纪经典了。
下面只说大家能看到的public poll
然后说一下2016年的poll到底出了什么问题。 实际上2016年的poll最后并没有错得“离谱”,主要问题集中在Blue Wall也就是现在说的中西部摇摆州。 这里有两个原因, 1 由于投票规则原因,中西部州大选日投票占比例极高,收到FBI bomb的影响最大。每一个poll都需要时间conduct,最后几天来不及了。 2 白人无大学学位男性这个voting block 取样不够。
第一个问题从pollster角度无法避免。第二个问题pollster现在都在拼命“矫正”。
大家现在会看到不同的poll出来的结果不同,原因主要在取样方式上。 如果我可以调查所有德州选民,那么我的预测肯定是最准确的,但是这不可能操作。 如果我取样里90%是奥斯丁居民,10%是红脖子,那肯定Biden躺赢了。反过来也肯定Trump躺赢:)
每个pollster的model都是不一样的。 一般来说会考虑到这个州的投票传统 比如 1 选民比例- 看一下此州的GOP:DEM:Independent选民注册比例。 (有些州并不按照party注册但是可以预计) 2 选民投票热情 (turnout) 3 也有很多其他参数 一般来说很多摇摆州 GOP注册选民少于DEM,而GOP选民的turnout高于DEM。(老头老太turnout最高,年轻人turnout最低)。GOP选民的turnout热情的区间跨越小很稳定。DEM选民的turnout却是过山车,有时倾巢而出,有时不肯出来。 所以很多model会给GOP取样这边提高一点weight来计算结果。
因为取样model的不同。pollster也会有“左右”之分。有的更偏左,有的偏右。有些pollster甚至是GOP/DEM internal. -这种pollster并不是"中立“的,而是和党派合作的,通常会非常pro这个党派。所以说如果这种internal poll都崩了,那就真的崩了。。。 所以看趋势的时候不妨多看看同一个pollster的不同日期结果变化。另外还有一种pollster是专门只做一两个州的,也很有意思。
回头说怎么看“白人无大学学位男性这个voting block 取样不够”这个2016的问题。也就是楼主的问题。 现在的pollster为了弥补这一条费劲了脑筋。- 这里有两种观点,一种认为是的取样不够,低估这个voting block的turnout。 一种认为是shy Trump voter. 也就是所谓的“口是心非”。 所以现在的pollster非常重视这个voting block。
-比如问“你邻居选谁?” 这样来排除噪音。这个办法在Trump supporter越来越响亮招摇后,越来越不好用了,想必大家有所体会。 于是现在甚至会问“你2016年选了谁?”“你2018年中期选举选了谁?”来排除。 比如现在已知某州白人无学位男性2012X投了O8. 2016 Y%投Trump, 2018 Z%投了GOP候选人。那么2020年我取样的时候会筛选出来相应的比例的回答了这个问题的被调查对象,考虑他们的答案。这样来“搭建”,而不是纯粹的把所有人都一模一样的算进去。一般来说撒谎自己过去选谁的人很少。。。
-横向比较。 每一个州都不是独立的。 比如西佛吉尼亚,是红的不能更红的Trump州。在这里做调查,“shy Trump voter"的可能性很低。对比2016的结果和2020的结果,如果Trump的support掉了,那么就的确是真的掉了。一般来说shift的比例在临近的州的相同block会差不多。
-对turnout的估计 最难估计的就是早票占比少的州的turnout形式 IL早票开的很早。虽然IL是深蓝州。但是IL的乡下人民的turnout和隔壁中西部州的turnout相比往年趋势区别不会太大(也要考虑是否有大麻,州长这样的议题) 维吉尼亚早票也是开的很早,其中的county by county的趋势也可以推论隔壁几个州的趋势。 佐治亚的黑人大波出动投票,也可以推论到Southern的黑人投票率会增高。 所以早票开始之后,民调会修正估计值,民调会越来越接近真实情况。
-有些州的独特县 比如AZ 一个Maricopa county占了60%+的选票。你可以就盯准一个地方用力研究,深入调查。很多private雇来pollster的就是深耕一两个地方。一些注册选民,当地的基层党组织对你已经很了解了,撒谎其实效果不大,更何况大部分人不撒谎= = 其他的摇摆州也有“重点县”,未必是因为“人数多”,而是这个县要么站在了整个州的政治光谱的中间,要么是有一个对两边至关重要的voting block. 比如MI的Wayne County,PA 的Erie,FL 的Sumter 等等。 FL的Sumter就是大名鼎鼎的the Villages 退休村。这里的老人很大程度代表了FL重要voting block - seniors。打个比方,如果估计GOP需要赢FL 60%老人票,但是发现只有55%的老人票拿到了,那么就大事不好了,必须调整策略。
最后说一句 看poll不如看钱看竞选团队在向什么地方跑 看一看两边的阵营的钱在向什么地方花。他们看到的是我们看不到的精确poll,可以得到基层党组织的汇报。这个动向更为准确。
梅干茶泡饭 发表于 2020-10-17 16:51

谢谢分享,学习了。
落地无声
喜欢诗吗?
pwwp 发表于 2020-10-17 18:22

落地无声
我看有些民调的样本也就1000人啊。真心不算大!
xiaomaoma 发表于 2020-10-17 17:06

有好几个5千多人的poll
落地无声
有很多办法 一会我回来写 回来了 我写一些 事先声明我不是pollster 但是的确对这些比较感兴趣 贡献下自己的“一知半解”吧
首先强调下pollster里,不是所有的都是political的,很多做的是商业的poll. 打个比方,某时尚公司想知道大家想要什么颜色的包包,于是hire一个外界pollster来调查一下大家的喜好, 决定明年做什么包包。这样更常见。这是一个非常大的industry.
political poll里,大家在电视上看到的是都是免费向民众公布的public的poll,也就是常见的YouGov, Emerson, Quinnipiac等结果。实际上竞选团队和一些利益相关的机构(比如股市相关的)会去花钱买private的poll, 比如Kellyanne Conway就是做pollster起家,她的Twitter账号就叫@KellyannePolls。这些private 的poll更有针对性,通常更为准确尖锐,但是你不会在电视上看到。
民众看Poll关心的是谁会赢。而竞选团队关注的是如果制定策略,下一步还有那些人可以争取,资源怎么分配。
毕竟美国的制度在绝大部分州是赢者通吃。
希拉里是资源分配的大输家,用在AZ等地的资源稍微倾斜一下Blue Wall结果就会大不相同。实际上她“辛勤耕耘”“开动马力”的主攻的地方取得的成绩是不错的,比如NH这样很难赢的州。 而Trump在Kellyanne的精准民调指挥下,精准的把更少的资源投放在关键的地方,在WI MI PA都是<1%的差距赢下整个州。可以说是世纪经典了。
下面只说大家能看到的public poll
然后说一下2016年的poll到底出了什么问题。 实际上2016年的poll最后并没有错得“离谱”,主要问题集中在Blue Wall也就是现在说的中西部摇摆州。 这里有两个原因, 1 由于投票规则原因,中西部州大选日投票占比例极高,收到FBI bomb的影响最大。每一个poll都需要时间conduct,最后几天来不及了。 2 白人无大学学位男性这个voting block 取样不够。
第一个问题从pollster角度无法避免。第二个问题pollster现在都在拼命“矫正”。
大家现在会看到不同的poll出来的结果不同,原因主要在取样方式上。 如果我可以调查所有德州选民,那么我的预测肯定是最准确的,但是这不可能操作。 如果我取样里90%是奥斯丁居民,10%是红脖子,那肯定Biden躺赢了。反过来也肯定Trump躺赢:)
每个pollster的model都是不一样的。 一般来说会考虑到这个州的投票传统 比如 1 选民比例- 看一下此州的GOP:DEM:Independent选民注册比例。 (有些州并不按照party注册但是可以预计) 2 选民投票热情 (turnout) 3 也有很多其他参数 一般来说很多摇摆州 GOP注册选民少于DEM,而GOP选民的turnout高于DEM。(老头老太turnout最高,年轻人turnout最低)。GOP选民的turnout热情的区间跨越小很稳定。DEM选民的turnout却是过山车,有时倾巢而出,有时不肯出来。 所以很多model会给GOP取样这边提高一点weight来计算结果。
因为取样model的不同。pollster也会有“左右”之分。有的更偏左,有的偏右。有些pollster甚至是GOP/DEM internal. -这种pollster并不是"中立“的,而是和党派合作的,通常会非常pro这个党派。所以说如果这种internal poll都崩了,那就真的崩了。。。 所以看趋势的时候不妨多看看同一个pollster的不同日期结果变化。另外还有一种pollster是专门只做一两个州的,也很有意思。
回头说怎么看“白人无大学学位男性这个voting block 取样不够”这个2016的问题。也就是楼主的问题。 现在的pollster为了弥补这一条费劲了脑筋。- 这里有两种观点,一种认为是的取样不够,低估这个voting block的turnout。 一种认为是shy Trump voter. 也就是所谓的“口是心非”。 所以现在的pollster非常重视这个voting block。
-比如问“你邻居选谁?” 这样来排除噪音。这个办法在Trump supporter越来越响亮招摇后,越来越不好用了,想必大家有所体会。 于是现在甚至会问“你2016年选了谁?”“你2018年中期选举选了谁?”来排除。 比如现在已知某州白人无学位男性2012X投了O8. 2016 Y%投Trump, 2018 Z%投了GOP候选人。那么2020年我取样的时候会筛选出来相应的比例的回答了这个问题的被调查对象,考虑他们的答案。这样来“搭建”,而不是纯粹的把所有人都一模一样的算进去。一般来说撒谎自己过去选谁的人很少。。。
-横向比较。 每一个州都不是独立的。 比如西佛吉尼亚,是红的不能更红的Trump州。在这里做调查,“shy Trump voter"的可能性很低。对比2016的结果和2020的结果,如果Trump的support掉了,那么就的确是真的掉了。一般来说shift的比例在临近的州的相同block会差不多。
-对turnout的估计 最难估计的就是早票占比少的州的turnout形式 IL早票开的很早。虽然IL是深蓝州。但是IL的乡下人民的turnout和隔壁中西部州的turnout相比往年趋势区别不会太大(也要考虑是否有大麻,州长这样的议题) 维吉尼亚早票也是开的很早,其中的county by county的趋势也可以推论隔壁几个州的趋势。 佐治亚的黑人大波出动投票,也可以推论到Southern的黑人投票率会增高。 所以早票开始之后,民调会修正估计值,民调会越来越接近真实情况。
-有些州的独特县 比如AZ 一个Maricopa county占了60%+的选票。你可以就盯准一个地方用力研究,深入调查。很多private雇来pollster的就是深耕一两个地方。一些注册选民,当地的基层党组织对你已经很了解了,撒谎其实效果不大,更何况大部分人不撒谎= = 其他的摇摆州也有“重点县”,未必是因为“人数多”,而是这个县要么站在了整个州的政治光谱的中间,要么是有一个对两边至关重要的voting block. 比如MI的Wayne County,PA 的Erie,FL 的Sumter 等等。 FL的Sumter就是大名鼎鼎的the Villages 退休村。这里的老人很大程度代表了FL重要voting block - seniors。打个比方,如果估计GOP需要赢FL 60%老人票,但是发现只有55%的老人票拿到了,那么就大事不好了,必须调整策略。
最后说一句 看poll不如看钱看竞选团队在向什么地方跑 看一看两边的阵营的钱在向什么地方花。他们看到的是我们看不到的精确poll,可以得到基层党组织的汇报。这个动向更为准确。
梅干茶泡饭 发表于 2020-10-17 16:51

和我看到的几篇文章差不多。16年其实没差很多,fbi是最后一脚踢下了希拉里。18年没有太多的惊喜,就准了。 poll没用,要看多少人出来投票。16年明显的民主党turnout不行。
a
akara1101
没明白这种测试为什么。这不很容易误导结果吗? 本来选A,硬币反应出的选B, 很多人自然就选B了啊。
公用马甲3 发表于 2020-10-17 19:18

😂,你是真没看懂啊。做调查的人又看不见被调查者的硬币结果,所以被调查者可以不需要担心任何后果的说出自己内心的真实想法,因为不管是什么,是”天意”,所以不存在透露自己政治倾向的问题,等于保护了自己的privacy。
不过如果真的问到像你这样的被调查者也是白搭😅,当然了,这只是一个理论,并没有真的用在实践中。
现实中的简单粗暴版就是问,你觉得你的邻居会选谁?
liucoan
😂,你是真没看懂啊。做调查的人又看不见被调查者的硬币结果,所以被调查者可以不需要担心任何后果的说出自己内心的真实想法,因为不管是什么,是”天意”,所以不存在透露自己政治倾向的问题,等于保护了自己的privacy。
不过如果真的问到像你这样的被调查者也是白搭😅,当然了,这只是一个理论,并没有真的用在实践中。
现实中的简单粗暴版就是问,你觉得你的邻居会选谁?
akara1101 发表于 2020-10-17 20:38

你说的这些把我也搞糊涂了,搞这么个硬币的point是什么?
邻居那个,更直接,很好明白。
a
akara1101
你说的这些把我也搞糊涂了,搞这么个硬币的point是什么?
邻居那个,更直接,很好明白。
liucoan 发表于 2020-10-17 22:17

很简单啊,在不透露自己政治倾向的前提下给出准确答案啊,这个很难理解吗?
政治倾向是一种隐私,某种意义上来说。
ca563
是先从问你州里候选人的倾向上,感觉你在大选投谁这个问题上,一致不一致吗?
公用马甲3 发表于 2020-10-17 19:27

可能吧,我对政治不关心,这次是入籍以后第一次投票。所以本州的几个候选人大部分都不知道。我注册的是independent。
hotyoga
但是在蓝色恐怖之下, 你还能怎么办?
我还注册为民主党哪, 因为如果注册为共和党, 你就收不到选票。
qd1981 发表于 2020-10-17 19:35

这个在我们州行不通,只能投注册党内的
ChristinaW
有很多办法 一会我回来写 回来了 我写一些 事先声明我不是pollster 但是的确对这些比较感兴趣 贡献下自己的“一知半解”吧
首先强调下pollster里,不是所有的都是political的,很多做的是商业的poll. 打个比方,某时尚公司想知道大家想要什么颜色的包包,于是hire一个外界pollster来调查一下大家的喜好, 决定明年做什么包包。这样更常见。这是一个非常大的industry.
political poll里,大家在电视上看到的是都是免费向民众公布的public的poll,也就是常见的YouGov, Emerson, Quinnipiac等结果。实际上竞选团队和一些利益相关的机构(比如股市相关的)会去花钱买private的poll, 比如Kellyanne Conway就是做pollster起家,她的Twitter账号就叫@KellyannePolls。这些private 的poll更有针对性,通常更为准确尖锐,但是你不会在电视上看到。
民众看Poll关心的是谁会赢。而竞选团队关注的是如果制定策略,下一步还有那些人可以争取,资源怎么分配。
毕竟美国的制度在绝大部分州是赢者通吃。
希拉里是资源分配的大输家,用在AZ等地的资源稍微倾斜一下Blue Wall结果就会大不相同。实际上她“辛勤耕耘”“开动马力”的主攻的地方取得的成绩是不错的,比如NH这样很难赢的州。 而Trump在Kellyanne的精准民调指挥下,精准的把更少的资源投放在关键的地方,在WI MI PA都是<1%的差距赢下整个州。可以说是世纪经典了。
下面只说大家能看到的public poll
然后说一下2016年的poll到底出了什么问题。 实际上2016年的poll最后并没有错得“离谱”,主要问题集中在Blue Wall也就是现在说的中西部摇摆州。 这里有两个原因, 1 由于投票规则原因,中西部州大选日投票占比例极高,收到FBI bomb的影响最大。每一个poll都需要时间conduct,最后几天来不及了。 2 白人无大学学位男性这个voting block 取样不够。
第一个问题从pollster角度无法避免。第二个问题pollster现在都在拼命“矫正”。
大家现在会看到不同的poll出来的结果不同,原因主要在取样方式上。 如果我可以调查所有德州选民,那么我的预测肯定是最准确的,但是这不可能操作。 如果我取样里90%是奥斯丁居民,10%是红脖子,那肯定Biden躺赢了。反过来也肯定Trump躺赢:)
每个pollster的model都是不一样的。 一般来说会考虑到这个州的投票传统 比如 1 选民比例- 看一下此州的GOP:DEM:Independent选民注册比例。 (有些州并不按照party注册但是可以预计) 2 选民投票热情 (turnout) 3 也有很多其他参数 一般来说很多摇摆州 GOP注册选民少于DEM,而GOP选民的turnout高于DEM。(老头老太turnout最高,年轻人turnout最低)。GOP选民的turnout热情的区间跨越小很稳定。DEM选民的turnout却是过山车,有时倾巢而出,有时不肯出来。 所以很多model会给GOP取样这边提高一点weight来计算结果。
因为取样model的不同。pollster也会有“左右”之分。有的更偏左,有的偏右。有些pollster甚至是GOP/DEM internal. -这种pollster并不是"中立“的,而是和党派合作的,通常会非常pro这个党派。所以说如果这种internal poll都崩了,那就真的崩了。。。 所以看趋势的时候不妨多看看同一个pollster的不同日期结果变化。另外还有一种pollster是专门只做一两个州的,也很有意思。
回头说怎么看“白人无大学学位男性这个voting block 取样不够”这个2016的问题。也就是楼主的问题。 现在的pollster为了弥补这一条费劲了脑筋。- 这里有两种观点,一种认为是的取样不够,低估这个voting block的turnout。 一种认为是shy Trump voter. 也就是所谓的“口是心非”。 所以现在的pollster非常重视这个voting block。
-比如问“你邻居选谁?” 这样来排除噪音。这个办法在Trump supporter越来越响亮招摇后,越来越不好用了,想必大家有所体会。 于是现在甚至会问“你2016年选了谁?”“你2018年中期选举选了谁?”来排除。 比如现在已知某州白人无学位男性2012X投了O8. 2016 Y%投Trump, 2018 Z%投了GOP候选人。那么2020年我取样的时候会筛选出来相应的比例的回答了这个问题的被调查对象,考虑他们的答案。这样来“搭建”,而不是纯粹的把所有人都一模一样的算进去。一般来说撒谎自己过去选谁的人很少。。。
-横向比较。 每一个州都不是独立的。 比如西佛吉尼亚,是红的不能更红的Trump州。在这里做调查,“shy Trump voter"的可能性很低。对比2016的结果和2020的结果,如果Trump的support掉了,那么就的确是真的掉了。一般来说shift的比例在临近的州的相同block会差不多。
-对turnout的估计 最难估计的就是早票占比少的州的turnout形式 IL早票开的很早。虽然IL是深蓝州。但是IL的乡下人民的turnout和隔壁中西部州的turnout相比往年趋势区别不会太大(也要考虑是否有大麻,州长这样的议题) 维吉尼亚早票也是开的很早,其中的county by county的趋势也可以推论隔壁几个州的趋势。 佐治亚的黑人大波出动投票,也可以推论到Southern的黑人投票率会增高。 所以早票开始之后,民调会修正估计值,民调会越来越接近真实情况。
-有些州的独特县 比如AZ 一个Maricopa county占了60%+的选票。你可以就盯准一个地方用力研究,深入调查。很多private雇来pollster的就是深耕一两个地方。一些注册选民,当地的基层党组织对你已经很了解了,撒谎其实效果不大,更何况大部分人不撒谎= = 其他的摇摆州也有“重点县”,未必是因为“人数多”,而是这个县要么站在了整个州的政治光谱的中间,要么是有一个对两边至关重要的voting block. 比如MI的Wayne County,PA 的Erie,FL 的Sumter 等等。 FL的Sumter就是大名鼎鼎的the Villages 退休村。这里的老人很大程度代表了FL重要voting block - seniors。打个比方,如果估计GOP需要赢FL 60%老人票,但是发现只有55%的老人票拿到了,那么就大事不好了,必须调整策略。
最后说一句 看poll不如看钱看竞选团队在向什么地方跑 看一看两边的阵营的钱在向什么地方花。他们看到的是我们看不到的精确poll,可以得到基层党组织的汇报。这个动向更为准确。
梅干茶泡饭 发表于 2020-10-17 16:51

梅姐太厉害了~~手工点赞~~
ChristinaW
另外补充一句
不要再看YouTube Twitter的留言回复 赞踩 流量这些标准 来得出结论了
1 今年是re-election 所以流量本身不会均衡 2 保守派这边在AZ搞了个online troll farm 搜一搜新闻 他们公开承认的 主攻FB YouTube 3 同样,民主党也在自己的阵地,主要是Twitter上各种舆论战 4 那么哪边网上舆论战搞得更火呢?因为竞选资金是必须公开流向的,目前GOP在online花的钱远超过DEM。当然花钱最后的效果咱就不知道了。
梅干茶泡饭 发表于 2020-10-17 18:19

对哦,川普没钱买电视广告,只好网上买水军, 主力是油管facebook,随便漏一点,就足够把华人网颠覆了。
nv_nv
有很多办法 一会我回来写 回来了 我写一些 事先声明我不是pollster 但是的确对这些比较感兴趣 贡献下自己的“一知半解”吧
首先强调下pollster里,不是所有的都是political的,很多做的是商业的poll. 打个比方,某时尚公司想知道大家想要什么颜色的包包,于是hire一个外界pollster来调查一下大家的喜好, 决定明年做什么包包。这样更常见。这是一个非常大的industry.
political poll里,大家在电视上看到的是都是免费向民众公布的public的poll,也就是常见的YouGov, Emerson, Quinnipiac等结果。实际上竞选团队和一些利益相关的机构(比如股市相关的)会去花钱买private的poll, 比如Kellyanne Conway就是做pollster起家,她的Twitter账号就叫@KellyannePolls。这些private 的poll更有针对性,通常更为准确尖锐,但是你不会在电视上看到。
民众看Poll关心的是谁会赢。而竞选团队关注的是如果制定策略,下一步还有那些人可以争取,资源怎么分配。
毕竟美国的制度在绝大部分州是赢者通吃。
希拉里是资源分配的大输家,用在AZ等地的资源稍微倾斜一下Blue Wall结果就会大不相同。实际上她“辛勤耕耘”“开动马力”的主攻的地方取得的成绩是不错的,比如NH这样很难赢的州。 而Trump在Kellyanne的精准民调指挥下,精准的把更少的资源投放在关键的地方,在WI MI PA都是<1%的差距赢下整个州。可以说是世纪经典了。
下面只说大家能看到的public poll
然后说一下2016年的poll到底出了什么问题。 实际上2016年的poll最后并没有错得“离谱”,主要问题集中在Blue Wall也就是现在说的中西部摇摆州。 这里有两个原因, 1 由于投票规则原因,中西部州大选日投票占比例极高,收到FBI bomb的影响最大。每一个poll都需要时间conduct,最后几天来不及了。 2 白人无大学学位男性这个voting block 取样不够。
第一个问题从pollster角度无法避免。第二个问题pollster现在都在拼命“矫正”。
大家现在会看到不同的poll出来的结果不同,原因主要在取样方式上。 如果我可以调查所有德州选民,那么我的预测肯定是最准确的,但是这不可能操作。 如果我取样里90%是奥斯丁居民,10%是红脖子,那肯定Biden躺赢了。反过来也肯定Trump躺赢:)
每个pollster的model都是不一样的。 一般来说会考虑到这个州的投票传统 比如 1 选民比例- 看一下此州的GOP:DEM:Independent选民注册比例。 (有些州并不按照party注册但是可以预计) 2 选民投票热情 (turnout) 3 也有很多其他参数 一般来说很多摇摆州 GOP注册选民少于DEM,而GOP选民的turnout高于DEM。(老头老太turnout最高,年轻人turnout最低)。GOP选民的turnout热情的区间跨越小很稳定。DEM选民的turnout却是过山车,有时倾巢而出,有时不肯出来。 所以很多model会给GOP取样这边提高一点weight来计算结果。
因为取样model的不同。pollster也会有“左右”之分。有的更偏左,有的偏右。有些pollster甚至是GOP/DEM internal. -这种pollster并不是"中立“的,而是和党派合作的,通常会非常pro这个党派。所以说如果这种internal poll都崩了,那就真的崩了。。。 所以看趋势的时候不妨多看看同一个pollster的不同日期结果变化。另外还有一种pollster是专门只做一两个州的,也很有意思。
回头说怎么看“白人无大学学位男性这个voting block 取样不够”这个2016的问题。也就是楼主的问题。 现在的pollster为了弥补这一条费劲了脑筋。- 这里有两种观点,一种认为是的取样不够,低估这个voting block的turnout。 一种认为是shy Trump voter. 也就是所谓的“口是心非”。 所以现在的pollster非常重视这个voting block。
-比如问“你邻居选谁?” 这样来排除噪音。这个办法在Trump supporter越来越响亮招摇后,越来越不好用了,想必大家有所体会。 于是现在甚至会问“你2016年选了谁?”“你2018年中期选举选了谁?”来排除。 比如现在已知某州白人无学位男性2012X投了O8. 2016 Y%投Trump, 2018 Z%投了GOP候选人。那么2020年我取样的时候会筛选出来相应的比例的回答了这个问题的被调查对象,考虑他们的答案。这样来“搭建”,而不是纯粹的把所有人都一模一样的算进去。一般来说撒谎自己过去选谁的人很少。。。
-横向比较。 每一个州都不是独立的。 比如西佛吉尼亚,是红的不能更红的Trump州。在这里做调查,“shy Trump voter"的可能性很低。对比2016的结果和2020的结果,如果Trump的support掉了,那么就的确是真的掉了。一般来说shift的比例在临近的州的相同block会差不多。
-对turnout的估计 最难估计的就是早票占比少的州的turnout形式 IL早票开的很早。虽然IL是深蓝州。但是IL的乡下人民的turnout和隔壁中西部州的turnout相比往年趋势区别不会太大(也要考虑是否有大麻,州长这样的议题) 维吉尼亚早票也是开的很早,其中的county by county的趋势也可以推论隔壁几个州的趋势。 佐治亚的黑人大波出动投票,也可以推论到Southern的黑人投票率会增高。 所以早票开始之后,民调会修正估计值,民调会越来越接近真实情况。
-有些州的独特县 比如AZ 一个Maricopa county占了60%+的选票。你可以就盯准一个地方用力研究,深入调查。很多private雇来pollster的就是深耕一两个地方。一些注册选民,当地的基层党组织对你已经很了解了,撒谎其实效果不大,更何况大部分人不撒谎= = 其他的摇摆州也有“重点县”,未必是因为“人数多”,而是这个县要么站在了整个州的政治光谱的中间,要么是有一个对两边至关重要的voting block. 比如MI的Wayne County,PA 的Erie,FL 的Sumter 等等。 FL的Sumter就是大名鼎鼎的the Villages 退休村。这里的老人很大程度代表了FL重要voting block - seniors。打个比方,如果估计GOP需要赢FL 60%老人票,但是发现只有55%的老人票拿到了,那么就大事不好了,必须调整策略。
最后说一句 看poll不如看钱看竞选团队在向什么地方跑 看一看两边的阵营的钱在向什么地方花。他们看到的是我们看不到的精确poll,可以得到基层党组织的汇报。这个动向更为准确。
梅干茶泡饭 发表于 2020-10-17 16:51

扯这么长也没用。16年Trump 在宾州赢了四万多张票,现在宾州民调显示拜登领先。但是大选前宾州新注册共和党选民增加了20万,你觉得这20万人会投票给谁呢?同时民主党注册选民下降了几万。其他几个摇摆州也是一样的情况。在政治正确的风气下,谁敢说真话?一个老太太给我说她不敢在院子里插Trump 的牌子因为她年纪大了,无法经受一些人疯狂的攻击,所以她把牌子插在屋里。
且不说Trump 拉力场场人山人海,各种自发的汽车摩托车游艇场面壮观,就说我自己经历的很小的一件事吧。我看到Target 把川普和拜登做成搞笑的玩偶在卖,过几天再去发现trump 的卖完了,一个不剩,只有一堆拜登孤零零站在货架上。附近一个小区邻居在next door说自家院子Biden 的牌子被偷了,提醒附近居民小心,说自己报了警。平时美国人丢猫丢狗丢钥匙的,回复都是一堆;这个post 唯一一条回复是“ 你不该去找警察,你应该找social worker” 简直笑死人。
党国就不要研究美国问题了,真心的,党国永远也不会知道有个东西叫民意,因为他们不在乎不需要这个东西。
wa8445
从大数据中找金矿的多者呢,举个例子。 心理学家发现一个有趣的现象,做比较时,人们通常下意识的把自己喜欢和赞同放在前面。所以如果Google “Trump vs Hillary” 的比“Hillary vs Trump”的多,那么支持Trump的人就会多。这个当然有误差,但如果数据足够大,也可以很准的。
我没有说搜索谁的次数多谁就赢,这是你说的,我只是解释了一下为什么有人说的google search预测的准的原因。至于google search的预测怎么做的,肯定后面一堆人啊在弄啊。谁搜索次数多谁就赢确实是太糙了点,属于非常失败的数据分析……
akara1101 发表于 10/17/2020 5:21:34 PM
DP27
回复 48楼akara1101的帖子
你这不成了整个都是random了。应该是head就按照真实作答,tail就再扔硬币随机一个吧。 https://m.wikipedia.org/wiki/Randomized_response" target="_blank">https://en.https://m.wikipedia.org/wiki/Randomized_response
不过我感觉这种对于选举可能不太合适,因为一个A的坚定支持者可能压根不愿意回答是B,所以即使随机出了B,ta 也可能会说A,所以这问题又回到哪边的支持者更容易诚实作答了。
a
akara1101
回复 48楼akara1101的帖子
你这不成了整个都是random了。应该是head就按照真实作答,tail就再扔硬币随机一个吧。 https://m.wikipedia.org/wiki/Randomized_response" target="_blank">https://en.https://m.wikipedia.org/wiki/Randomized_response
不过我感觉这种对于选举可能不太合适,因为一个A的坚定支持者可能压根不愿意回答是B,所以即使随机出了B,ta 也可能会说A,所以这问题又回到哪边的支持者更容易诚实作答了。

DP27 发表于 2020-10-17 23:06

我说了这是一个理论,不是真的用于民调……主要说differential privacy,用民调打个比方
nv_nv
回复 48楼akara1101的帖子
你这不成了整个都是random了。应该是head就按照真实作答,tail就再扔硬币随机一个吧。 https://m.wikipedia.org/wiki/Randomized_response" target="_blank">https://en.https://m.wikipedia.org/wiki/Randomized_response
不过我感觉这种对于选举可能不太合适,因为一个A的坚定支持者可能压根不愿意回答是B,所以即使随机出了B,ta 也可能会说A,所以这问题又回到哪边的支持者更容易诚实作答了。

DP27 发表于 2020-10-17 23:06

民调也知道自己不准。能怎么办?假设民调现在显示Trump领先,这个大选还有什么好选的。民调好歹现在还能用来造势是吧,所有媒体言论控制到这个地步,却相信民调是不偏不倚,当谁是傻子吗?
DP27
回复 94楼akara1101的帖子
哈哈其实我也主要是想说你对randomized response的描述不太准确。 剩下的那部分主要是因为我自己前两天在想differential privacy能不能用于大选这类的民调。