如何评价微博有人指出双十一交易数据造假?

D
DarkChoco
引用 @恍如昨梦whu 发表的:
借用网友的一句话:

”你以为是对准靶子开枪,看看能不能10环

实际上是靶子和枪不断调整,确保一枪10环。”

这就是先制定销售指标,然后想方设法(最后几小时放券+折扣),完成kpi的玩法

真这么厉害淘宝改行做精算师算了

R
Reix
https://www.zhihu.com/question/355439478/answer/891493911
我觉得知乎这个回复比较靠谱 为了满足kpi来造假销售额是符合逻辑事实的
但是需要所有商家集体造假才能满足如此完美的拟合 好像哪里又有点不对……

A
ApollonCR
我倒是可以给一个其他的信息给大家参考。
双十一商品进入双十一大促的各个会场,产品的展示顺序逻辑是从双十一开始按销售总额每3分钟排序的,意思是买的越好越排在前面。
按照正常的逻辑是,提供更好的产品,更低的价格,就能展在前面,但是还有一种更简单的方式,刷单。
会场大商家的凌晨六个小时,刷单量就像是战场上的弹药随时准备着。那么在每个商家都在采用同样竞争手段的情况下,除了刷到大部分商家弹尽粮绝,那么会场的销售额就是会不断攀升。
简单的说,阿里平台的营销工具推广逻辑,也许志不在于鼓励刷单,就实际上就是在催生出刷单产业的稳定发展。


白_白白白
引用 @女票胸大腰细 发表的:
你的逻辑好像有点问题 难道逻辑链不是:淘宝数据可以拟合→怀疑作假→根据公式预测下年数据→预测准确→涉嫌作假

预测准确就是造假,那买彩票中奖也是造假

恍如昨梦whu
引用 @马机智 发表的:
层主按这个规律再算算明年的

微博原po主不是写了吗,分别按2次项和3次项预测,2018年的2135的拟合度是99.94%,在以基础上按照目前公布的2019年成交额(kpi)——2684来校核,拟合度更上一层楼:99.96%

附一张原po的从2019年开始的三次项拟合结果

干涸的海88
我艹,看不懂

l
lwmylove
引用 @一叶束水 发表的:
数据作假基本不可能,但是很明显天猫是内部定了自己的kpi,然后为了这个kpi在当天利用各种办法冲了数据。就像斗鱼主播冲榜,可能最后冲不上去了,工会大笔一挥帮你打了几个,确实主播没有得到那么多,但是数据也不算是假的。双十一当天看到kpi完不成了,就强迫继续打折,不允许下架等措施,最后冲击到可以完成的kpi收手。

严格点说的话,完成kpi那也算是造假吧
一叶束水
引用 @lwmylove 发表的:
严格点说的话,完成kpi那也算是造假吧

我就是这个意思 直接数据造假应该不会 但是这种冲业绩从严格意义上来说也是造假的一种

女票胸大腰细
引用 @一世书徒 发表的:
拿我去年的课程作业为例,elements of forecasting 里作者给的例子,R方0.995,这也是造假嘛?

宏观经济数据的性质是这样的,如果没有结构性变化很容易预测,宏观经济学家对于平常年份的经济增长预测比作者准多了。所谓预测不准只是说金融危机即结构性变化预测不准而已。但是双十一这种社会性的全民活动真的不需要考虑当前经济形势下行,并且竞争平台(拼多多、京东)强势崛起造成的影响?
女票胸大腰细
引用 @白_白白白 发表的:
预测准确就是造假,那买彩票中奖也是造假

你这个类比不准确,如果是按照你这个类比 应该是:已知前10次彩票中奖存在某种规律→怀疑造假→根据规律预测中奖人特征→预测准确→涉嫌造假
虎扑用户626020
引用 @女票胸大腰细 发表的:
你的逻辑好像有点问题 难道逻辑链不是:淘宝数据可以拟合→怀疑作假→根据公式预测下年数据→预测准确→涉嫌作假

你的逻辑真的很感人

一世书徒
引用 @女票胸大腰细 发表的:
你的逻辑好像有点问题 难道逻辑链不是:淘宝数据可以拟合→怀疑作假→根据公式预测下年数据→预测准确→涉嫌作假

借楼认真回复一下。
首先,这个回归的R方确实高的吓人,基本不太可能是自然生成机制下生成的数据,但不意味着一定就是简单的数据造假,更大的可能是正好发现了天猫KPI的内部隐藏机制。而且只有十个观测值,确实容易出现R方过高的可能。
其次,对于分析来说R方其实没那么重要。R方说明的是模型的解释力,也就是方程右边的变量能解释多少方程的左边。就算R方很大,也可能是伪回归,真正判断回归是否显著的是显著性检验,即对参数整体的F检验和对单个参数的t检验,不过看微博里好像没提到这个,所以无从判断这个回归是否是统计学意义上显著的。
第三,时间序列的R方普遍偏高,也就是说,对一个和时间有明显相关性(比如说GDP、出口额)的变量,只要找到合适的拟合方程,R方会普遍高一些。比如下图是Elements of forecasting里作者对酒精消费量和时间做回归的例子,R方达到了0.995。
第四,十个观察值确实太少了,做回归经常有句话叫你不可能做的比数据更好,因此只有十个观测值很难搞个大新闻。
综上,我的观点是,这么高的拟合程度确实很诡异,但考虑到观测值太少,又缺乏显著性检验,不能断言说是伪造出来的

单手打爆乔丹
引用 @纽约尼克杨 发表的:
还你来说句公道话,哈哈哈哈哈哈哈哈哈哈哈笑死个人咯

如何委婉的表达“我被收买了”?
1. 皇军托我捎句话
2. 我来说句公道话

虎扑用户656918
引用 @Ronaboom 发表的:
别一句无知,我意思是这个人用的这个计算方式,其他人可以从其他方面预测出其他数字,不一定要用他的这个理论啊

你就是没看懂在这里本能抬杠,人是半年前提出的这个,你要说半年前他恰好数据对上这个模型极小概率事件就算了,但是今年的销售额依然达到在数据点上那基本上就不是偶然了

臭弟弟我是你哥哥
引用 @DarkChoco 发表的:
真这么厉害淘宝改行做精算师算了

你难道觉得阿里不招吗

女票胸大腰细
引用 @一世书徒 发表的:
借楼认真回复一下。
首先,这个回归的R方确实高的吓人,基本不太可能是自然生成机制下生成的数据,但不意味着一定就是简单的数据造假,更大的可能是正好发现了天猫KPI的内部隐藏机制。而且只有十个观测值,确实容易出现R方过高的可能。
其次,对于分析来说R方其实没那么重要。R方说明的是模型的解释力,也就是方程右边的变量能解释多少方程的左边。就算R方很大,也可能是伪回归,真正判断回归是否显著的是显著性检验,即对参数整体的F检验和对单个参数的t检验,不过看微博里好像没提到这个,所以无从判断这个回归是否是统计学意义上显著的。
第三,时间序列的R方普遍偏高,也就是说,对一个和时间有明显相关性(比如说GDP、出口额)的变量,只要找到合适的拟合方程,R方会普遍高一些。比如下图是Elements of forecasting里作者对酒精消费量和时间做回归的例子,R方达到了0.995。
第四,十个观察值确实太少了,做回归经常有句话叫你不可能做的比数据更好,因此只有十个观测值很难搞个大新闻。
综上,我的观点是,这么高的拟合程度确实很诡异,但考虑到观测值太少,又缺乏显著性检验,不能断言说是伪造出来的

确实 我基本同意阿里应该存在内部KPI机制 通过KPI达成既定业绩 不过实际上KPI也是另一形式上的造假

不过我还是想说0.999 和0.99差蛮多的 差了一个数量级呢 嘻嘻
虎扑用户104918
引用 @DarkChoco 发表的:
真这么厉害淘宝改行做精算师算了

了解一下P9 P10 达摩院吧

库蓝
引用 @马机智 发表的:
层主按这个规律再算算明年的

3000亿,按照当前经济的形式 几乎不可能完成

衍生
引用 @虎扑JR0845983482 发表的:
你这回复暴露水平

这种杠精随处可见

虎扑用户964796
引用 @女票胸大腰细 发表的:
你的逻辑好像有点问题 难道逻辑链不是:淘宝数据可以拟合→怀疑作假→根据公式预测下年数据→预测准确→涉嫌作假

这就叫专业gif

虎扑用户054129
刚刚跑了一下,99.9638%

D
DarkChoco
引用 @臭弟弟我是你哥哥 发表的:
你难道觉得阿里不招吗

你知道能把数据刚刚做到r²值0.9是什么概念吗?这种精算师可以去运营国家了懂?

不按从
引用 @我不爱你12138 发表的:
他是4月份估计的,懂吗?今年预测偏差这么小,在实际生活中如果不是造假是不可能的。

上市公司要审计的吧,造假划不来啊,好处是可以拉一拉股价,风险无限大

1
19岁了
引用 @天赋带到罚球线 发表的:
诺贝尔数学奖?

那是鞋车的专属

你牛逼你上啊嘴贱
引用 @Jazyyyy 发表的:
问题是随便拿个国家中国或者美国的gdp来做拟合也可以得到R值0.99吧,美国中国都造假?

经济指标是一整年的。在有增长任务的情况下有可以控制的。双十一是一天的事情。

乔见Joy
引用 @大明湖畔的大明 发表的:
造假不至于,水分么大家都懂的

无视每年的经济行情,拟合度如此之高,不造假已经几乎是不可能的事情了

a
adachi
引用 @女票胸大腰细 发表的:
知乎一个用户的评论@摩尔根的白眼果蝇:即便是物理实验数据也不会有这样,数据点与拟合出的函数如此接近的情况。如果你去看那些生物化学的实验,数据点和拟合出的函数偏差万里也是常事。社会经济现象的混沌程度堪比生物化学(甚至有些学派的经济学家认为目前的数学手段无法做出有意义的模型),结果阿里的数据居然完美到这种程度,建议给马云颁发诺奖

我做的测试结果从没有过这么完美。。。。
佩服阿里,怪不得马云要进军基础科研领域,已经掌握了我们领域的核心竞争力 狗头
D
DarkChoco
引用 @八八两 发表的:
了解一下P9 P10 达摩院吧

市场经济学里r2超过0.81就是造假了,能调控到0.99的精算师就是宇宙第一神仙,什么达摩院直接去治理美国吧

世界Thrall
引用 @大明湖畔的大明 发表的:
造假不至于,水分么大家都懂的

数据有水分就是数据造假啊,不然造假还能怎么造

你扣脚的样子好美
引用 @羊总2号 发表的:
你有高中水平吗?

高中是学过统计的

c
cthyp
引用 @Sharksyu 发表的:
什么线性函数多项式拟不出来啊还真信啊

这个帖子拟合的曲线 ,和天猫那个比完全不是一个级别的 ,曲线放一起就行了,只看图都知道那个曲线过于完美。
L
LYJ9901
引用 @女票胸大腰细 发表的:
为什么不回复?本来就是发到步行街让大家讨论的 既然有支持的意见 肯定也会有反对的意见

别别别,不用回复我。既然这么理客中,就先把人层主123回复了好么?说句不中听的,遇到无法反驳的评论就是“大家讨论”,没遇到就先入为主歪屁股带节奏,好的坏的都你一人占全了。这么玩儿没劲

虎扑用户418197
引用 @女票胸大腰细 发表的:
为什么不回复?本来就是发到步行街让大家讨论的 既然有支持的意见 肯定也会有反对的意见

那你回复他啊

令锅的胖胖
引用 @世界Thrall 发表的:
数据有水分就是数据造假啊,不然造假还能怎么造

比如卖了1000亿,阿里说卖了2600亿,这是阿里造假,微博提出的就是这个问题。
比如卖了2600亿,第二天因为各种原因,退了300亿,这是有水分。
比如卖了2000亿,还有600亿是刷单的,这是店铺造假
虎宝卡
引用 @一叶束水 发表的:
数据作假基本不可能,但是很明显天猫是内部定了自己的kpi,然后为了这个kpi在当天利用各种办法冲了数据。就像斗鱼主播冲榜,可能最后冲不上去了,工会大笔一挥帮你打了几个,确实主播没有得到那么多,但是数据也不算是假的。双十一当天看到kpi完不成了,就强迫继续打折,不允许下架等措施,最后冲击到可以完成的kpi收手。

往年晚上九点十点左右会有回血红包,满额适用,今年没收到

虎扑用户713625
这件事说明了虎扑和微博的知识水平差不多,基本代表了大众平均水平。建议看下知乎上的相关信息🐶

B
BuckleUp
引用 @女票胸大腰细 发表的:
你的逻辑好像有点问题 难道逻辑链不是:淘宝数据可以拟合→怀疑作假→根据公式预测下年数据→预测准确→涉嫌作假

我觉得那种明显没有文化的人可以不用回他了,一看就完全不懂数学的人。这种概率极小的事情发生了就约等于造假实锤
衢州勒布朗
引用 @恍如昨梦whu 发表的:
借用网友的一句话:

”你以为是对准靶子开枪,看看能不能10环

实际上是靶子和枪不断调整,确保一枪10环。”

这就是先制定销售指标,然后想方设法(最后几小时放券+折扣),完成kpi的玩法

这就讲得通了。

詹吐司拉登
引用 @女票胸大腰细 发表的:
确实 我基本同意阿里应该存在内部KPI机制 通过KPI达成既定业绩 不过实际上KPI也是另一形式上的造假

不过我还是想说0.999 和0.99差蛮多的 差了一个数量级呢 嘻嘻

笑了0.999跟0.99差了一个数量级 统计就教会你看那0.09? 那0跟0.1多少个数量级 那统计量自由度这些拿来干嘛 还嘻嘻

K
KD灬KXD
引用 @DarkChoco 发表的:
市场经济学里r2超过0.81就是造假了,能调控到0.99的精算师就是宇宙第一神仙,什么达摩院直接去治理美国吧

去联合国解决一下世界级难题吧

K
KD灬KXD
引用 @爽的腰疼 发表的:
卧槽,你小学没毕业吧

差不多,顶多上完九年义务教育还吊车尾的水平

K
KD灬KXD
引用 @冰冻皮皮虾 发表的:
可能是股东吧

不,是单向亲儿子

雨巷中
引用 @一叶束水 发表的:
数据作假基本不可能,但是很明显天猫是内部定了自己的kpi,然后为了这个kpi在当天利用各种办法冲了数据。就像斗鱼主播冲榜,可能最后冲不上去了,工会大笔一挥帮你打了几个,确实主播没有得到那么多,但是数据也不算是假的。双十一当天看到kpi完不成了,就强迫继续打折,不允许下架等措施,最后冲击到可以完成的kpi收手。

卧槽有点道理

葛瑞
引用 @女票胸大腰细 发表的:
你的逻辑好像有点问题 难道逻辑链不是:淘宝数据可以拟合→怀疑作假→根据公式预测下年数据→预测准确→涉嫌作假

阿里财报符合预期—>阿里涉嫌财务造假

女票胸大腰细
引用 @虎扑JR1386387321 发表的:
那你回复他啊

我回复了呀 你仔细看
女票胸大腰细
引用 @詹吐司拉登 发表的:
笑了0.999跟0.99差了一个数量级 统计就教会你看那0.09? 那0跟0.1多少个数量级 那统计量自由度这些拿来干嘛 还嘻嘻

这我就不跟你争了 不过你可以看下知乎上关于0.999 和0.99差异的说法 是不是一个数量级的差异 嘻嘻
女票胸大腰细
引用 @tinytt 发表的:
这件事说明了虎扑和微博的知识水平差不多,基本代表了大众平均水平。建议看下知乎上的相关信息🐶

我觉得这种事情大家都有自己的看法 没有必要强行扯到平台

知乎高赞里也有不同论点的答案
姚暗
引用 @一世书徒 发表的:
拿我去年的课程作业为例,elements of forecasting 里作者给的例子,R方0.995,这也是造假嘛?

你这才几个变量

蓝一方
引用 @一叶束水 发表的:
数据作假基本不可能,但是很明显天猫是内部定了自己的kpi,然后为了这个kpi在当天利用各种办法冲了数据。就像斗鱼主播冲榜,可能最后冲不上去了,工会大笔一挥帮你打了几个,确实主播没有得到那么多,但是数据也不算是假的。双十一当天看到kpi完不成了,就强迫继续打折,不允许下架等措施,最后冲击到可以完成的kpi收手。

根本不可能,运营良好的天猫店有数十万家,阿里干涉他们经营的手段有限。跨店津贴是商家出的,阿里自己出的只有那点红包,它通过那点东西来撬动大盘是做不到的。
再换个角度,这几十万个商家里,自己设定目标,盘货以后交给阿里,他们完成率90%的都非常非常少,阿里有什么办法?

c
cathayandy
引用 @Jazyyyy 发表的:
问题是随便拿个国家中国或者美国的gdp来做拟合也可以得到R值0.99吧,美国中国都造假?

淘宝是0.9994,高了一个数量级。现在知乎上很多人举各种宏观数据来佐证淘宝没有造假,但却没有任何一个统计量的r-squared达到淘宝这个数量级的,感觉有点打脸。

有人说因为KPI是这么定的,淘宝只是努力完成了KPI,不算造假。我认同前半句,但是后半句我存疑,因为GDP也是KPI,而且是一年的累计量,按理说应该更好控制才对,但GDP都没有能拟合到0.9994这种程度。说明淘宝用的一些手段已经超出正常的做数据的范围了。
一世书徒
引用 @姚暗 发表的:
你这才几个变量

微博上那个回归就俩变量,这个有两个时间趋势,12个虚拟变量和三个滞后项啊

一世书徒
引用 @女票胸大腰细 发表的:
确实 我基本同意阿里应该存在内部KPI机制 通过KPI达成既定业绩 不过实际上KPI也是另一形式上的造假

不过我还是想说0.999 和0.99差蛮多的 差了一个数量级呢 嘻嘻

0.99和0.999真的没有本质的区别……一个说模型因变量的99%能解释,另一个说模型因变量的99.9%被解释,并没有本质的区别,你去看顶刊上的论文,R方20%的也有,甚至十几的也有

虎扑用户713625
引用 @女票胸大腰细 发表的:
我觉得这种事情大家都有自己的看法 没有必要强行扯到平台

知乎高赞里也有不同论点的答案

是的,我支持大家有不同的看法,而且这些观点是没有高下之分的。但是明显虎扑焦点还是在争一些比较浅显的东西

c
cathayandy
引用 @一世书徒 发表的:
拿我去年的课程作业为例,elements of forecasting 里作者给的例子,R方0.995,这也是造假嘛?

你这个r-squared也没有0.9994啊,我看了知乎上列举的所有宏观统计量,没有一个r-squared到淘宝这个量级的,基本都是你这个量级。而且淘宝这个二次拟合就已经有这个精度了,并且系数很漂亮。
恍如昨梦whu
引用 @Sharksyu 发表的:
我建议你可以搜一下知乎上面的解释详细一点,几个问题我觉得可以去研究的,这个人到底是在拟合现有数据还是根据过去的数据拟合了一个模型做的预测,首先数据量不算今年只有9个,根据这些数据去拟合一个函数然后预测今年的数据,假如预测结果和今年真的非常“准确”那我觉得能有几个可能,第一原先就有这个模型天猫每年都在按照这个模型去造假或者这是他们内部KPI的曲线每年去“接近”这个数据,我觉得这两个情况都不现实,我觉得阿里也没有这个能力在09年就制定出这个曲线所以不管是造假说还是KPI说,我觉得都不大可能;第二种可能就是这个博主知道了今年阿里内部KPI指标然后用10个数据拟合了一个模型然后,然后给了这个爆料所以和实际结果很接近,第三种我觉得很简单是博主猜的,但是三种可能性让我排的话,2>3>1,我觉得统计理论可以讨论,阴谋论就是各自猜测了,这只是我的看法

前4年样本过少,没有拟合意义。

从第5年开始拟合,依次计算5/6/7/8/9/10/11年后(也就是2019年)的拟合度。

2014-2019年的拟合度画风优美(左图)。

很大可能性,TB对其官方公布的成交额做过修正,校正使其更接近于”预测值”,以达到极高的拟合度。
(也有可能,设立kpi,然后开始筹备,刷到接近”预测值”数额了就ok)

左图右下角为原微博po主对2019-2022的拟合预测结果。(详情见右图)

2019年的官方成交额——2684亿,完美的落在了po主的”预测值区间”内。
2019年的2684亿,与2009-2018的曲线拟合之后,得到99.96%的拟合度。这一结果,简直就像”捏造”的一样夸张。

一世书徒
引用 @cathayandy 发表的:
淘宝是0.9994,高了一个数量级。现在知乎上很多人举各种宏观数据来佐证淘宝没有造假,但却没有任何一个统计量的r-squared达到淘宝这个数量级的,感觉有点打脸。

有人说因为KPI是这么定的,淘宝只是努力完成了KPI,不算造假。我认同前半句,但是后半句我存疑,因为GDP也是KPI,而且是一年的累计量,按理说应该更好控制才对,但GDP都没有能拟合到0.9994这种程度。说明淘宝用的一些手段已经超出正常的做数据的范围了。

啥叫高了一个数量级?R方本来就是一个取值从0到1的数,0.99和0.999区别不大。而且R方并不是评价一个模型好坏的主要标准

斯凯奇运动鞋专卖店
引用 @这个三分能进 发表的:
张口就来?
三分之一后面的数据,样本,测算,在哪儿呢?
你可以说有一定水分,但是要有理有据,比如之前有统计双11订单退货是12%多一点。

分类目的,这几年我做的店铺,女装最高25%,鞋加上换号18%左右,童装10%,电话卡最低,基本可以忽略

一世书徒
引用 @恍如昨梦whu 发表的:
99%,99.9%,99.99%,区别很大,目前十年数据拟合度是99.96%,很夸张

我请教一下,哪本计量书上提到r方取0.99/0.999/0.9999不是一个量级了?一般来说r方在0.9以上就是很高了,那0.001没什么区别。

恍如昨梦whu
引用 @一世书徒 发表的:
我请教一下,哪本计量书上提到r方取0.99/0.999/0.9999不是一个量级了?一般来说r方在0.9以上就是很高了,那0.001没什么区别。

你是认真的么……0.99,0.999,0.9996差别大了去了

一世书徒
引用 @女票胸大腰细 发表的:
宏观经济数据的性质是这样的,如果没有结构性变化很容易预测,宏观经济学家对于平常年份的经济增长预测比作者准多了。所谓预测不准只是说金融危机即结构性变化预测不准而已。但是双十一这种社会性的全民活动真的不需要考虑当前经济形势下行,并且竞争平台(拼多多、京东)强势崛起造成的影响?

我不懂你的意思。
1.你说宏观经济数据比全民参与的微观数据更容易预测,依据是什么?微观需要考虑经济下行,宏观也一样需要。
2.这个回归是对酒精消费量时间趋势的回归,也就是卖了多少酒,是严格的微观市场数据

一世书徒
引用 @cathayandy 发表的:
你这个r-squared也没有0.9994啊,我看了知乎上列举的所有宏观统计量,没有一个r-squared到淘宝这个量级的,基本都是你这个量级。而且淘宝这个二次拟合就已经有这个精度了,并且系数很漂亮。

r方0.999和0.99,甚至是0.95都没有显著的区别。
r方在描述的是方程右边对左边的解释力,也就是说左边变化占右边变化的多少。时间趋势能解释99%的交易量变化,和能解释99.9%的交易量变化,没有什么区别

乐观的游啊游
引用 @可别忘了初心吧 发表的:
去原微博看,已经删除了。

一般这种情况,一是被恐吓,二是收钱了

虎扑用户251989
引用 @恍如昨梦whu 发表的:
借用网友的一句话:

”你以为是对准靶子开枪,看看能不能10环

实际上是靶子和枪不断调整,确保一枪10环。”

这就是先制定销售指标,然后想方设法(最后几小时放券+折扣),完成kpi的玩法

在知乎上看的吧,说这话的是新浪的咕哒丞相。
二院二栋栋长
引用 @我不爱你12138 发表的:
他是4月份估计的,懂吗?今年预测偏差这么小,在实际生活中如果不是造假是不可能的。

定好这个目标再去想策略完成不就行了,对于阿里这种公司来说不是什么太难的事

一世书徒
引用 @恍如昨梦whu 发表的:
你是认真的么……0.99,0.999,0.9996差别大了去了

哪本书上说的,我从本科开始就是学经济的,到现在快十年了,不是装逼,但因为自己一直在做的就是计量分析,算是老本行,也从来没听有人说过r方0.99和0.999有本质的区别,如果你能说明出处的话我发自内心地感谢你的指点,但据我看过的几本教材里,没有说过这个的

想读书的冬枣
引用 @传说中神一样的男人 发表的:
话说r²就是拟合度吗

就是回归方程拟合优度嘛

纳瑞斯塔
引用 @女票胸大腰细 发表的:
你的逻辑好像有点问题 难道逻辑链不是:淘宝数据可以拟合→怀疑作假→根据公式预测下年数据→预测准确→涉嫌作假

就这么几个点怎么不能拟合了,历史几年的数据拿lstm预测aqi,acc可以跑到0.97+

c
cathayandy
引用 @一世书徒 发表的:
r方0.999和0.99,甚至是0.95都没有显著的区别。
r方在描述的是方程右边对左边的解释力,也就是说左边变化占右边变化的多少。时间趋势能解释99%的交易量变化,和能解释99.9%的交易量变化,没有什么区别

你这个角度片面了,你应该从事实来看,事实是没有宏观统计量的r方有这么高,我只在做大物实验的时候才见过这么高的r方。0.95和0.99和0.999差距太大了,你给一个不懂数学的人看图,都能看出来这其中的区别。

而且你看它二次拟合的系数,也很漂亮啊,不仅是r方的问题。
恍如昨梦whu
引用 @一世书徒 发表的:
哪本书上说的,我从本科开始就是学经济的,到现在快十年了,不是装逼,但因为自己一直在做的就是计量分析,算是老本行,也从来没听有人说过r方0.99和0.999有本质的区别,如果你能说明出处的话我发自内心地感谢你的指点,但据我看过的几本教材里,没有说过这个的

学经济用回归,具体怎么用,精度多高,我确实不清楚。
但是做实验用拟合,生物化学类实验我不说,做物理仿真实验,尤其是做流体等仿真实验时,变量非常多,网格划分数量以k为基础单位,你有想过对变量拟合度的要求有多高吗,精度这个东西,每个数量级上有天壤之别。 这些东西你让我去找书,我才疏学浅,毕业几年了,以前也是疏于记录学了就忘,确实找不出来。但是你可以找几个研究生,做过流体或者相关物理仿真的,或者老师,听听他们的意见问问0.95 0.99 0.999 0.9996有没有本质区别 [ 此帖被恍如昨梦whu在2019-11-12 21:49修改 ]

虎扑用户641607
引用 @二院二栋栋长 发表的:
定好这个目标再去想策略完成不就行了,对于阿里这种公司来说不是什么太难的事

这种就是造假,对于上市公司很严重的。我服了你了

米兰故事多
引用 @一叶束水 发表的:
我就是这个意思 直接数据造假应该不会 但是这种冲业绩从严格意义上来说也是造假的一种

字多看着晕,简单理解,是不是类似于某些销售部门的自己刷单冲业绩?

船到桥头自然直fit
引用 @女票胸大腰细 发表的:
你的逻辑好像有点问题 难道逻辑链不是:淘宝数据可以拟合→怀疑作假→根据公式预测下年数据→预测准确→涉嫌作假

正解,正是因为KPI系数指标每年都是定好,增长率也是固定,所以归化方程式来讲,细分下来,也就不难解释双十一销售额的增长规律肯定有水分。当然,对普通人来说,这个我们有何想干。但我就是看不爽这种营造出来的虚假繁荣,明明肉都快吃不起了,各行各业都不景气,物价指数CPI快涨上天,还要去营造一种欣欣向荣的假象。无不无聊,怀着明白装糊涂。

这个三分能进
引用 @斯凯奇运动鞋专卖店 发表的:
分类目的,这几年我做的店铺,女装最高25%,鞋加上换号18%左右,童装10%,电话卡最低,基本可以忽略

对嘛,这才叫有发言权,而不是张口就来的什么保守三分之一。

菰城小学生
引用 @我已经偷完主宰 发表的:
人家半年前的预测,蹭什么热度?

今年的确感觉有点假,经济这么不景气不说,拼夕夕也分走了不少羹吧。

虎扑用户143326
引用 @想读书的冬枣 发表的:
就是回归方程拟合优度嘛

我只学过线性的,r方叫解释比例,我也不懂hh

想读书的冬枣
引用 @传说中神一样的男人 发表的:
我只学过线性的,r方叫解释比例,我也不懂hh

差不多差不多

恍如昨梦whu
引用 @阳光男孩蔡徐坤 发表的:
在知乎上看的吧,说这话的是新浪的咕哒丞相。

是的,扫了一圈精华帖,对这句话印象深刻,不过po主叫什么我忘了

虎扑用户143326
引用 @想读书的冬枣 发表的:
差不多差不多

那解释比例和拟合优度,是两个概念吗

J
Jazyyyy
引用 @你牛逼你上啊嘴贱 发表的:
经济指标是一整年的。在有增长任务的情况下有可以控制的。双十一是一天的事情。

你不会以为双十一没有指标吧?

A
Anonym么
引用 @曲尽通幽 发表的:
来,告诉我第二张图预测那几个大字你是不是瞎了才看不到?然后第一张图显示四月份发的,别跟我说人家是马后炮

人家看不到的

天涯狼藉
请问就算他作假了又怎么样呢,这个数据于你有关么,我只在乎我在双十一有没有花同样的钱买到更多的东西

想读书的冬枣
引用 @传说中神一样的男人 发表的:
那解释比例和拟合优度,是两个概念吗

是一个意思吧

P
ProfESDer
引用 @女票胸大腰细 发表的:
你的逻辑好像有点问题 难道逻辑链不是:淘宝数据可以拟合→怀疑作假→根据公式预测下年数据→预测准确→涉嫌作假

借楼
虽然不懂回归曲线,但这集我看过---十年前的麦道夫。当时就有人做出过他的投资回报曲线,完美得不真实,只是人们没当回事,后来的事都知道了

一世书徒
引用 @恍如昨梦whu 发表的:
学经济用回归,具体怎么用,精度多高,我确实不清楚。
但是做实验用拟合,生物化学类实验我不说,做物理仿真实验,尤其是做流体等仿真实验时,变量非常多,网格划分数量以k为基础单位,你有想过对变量拟合度的要求有多高吗,精度这个东西,每个数量级上有天壤之别。 这些东西你让我去找书,我才疏学浅,毕业几年了,以前也是疏于记录学了就忘,确实找不出来。但是你可以找几个研究生,做过流体或者相关物理仿真的,或者老师,听听他们的意见问问0.95 0.99 0.999 0.9996有没有本质区别

我对大物不清楚,也没学过生物化学实验,但据我对经济学的了解,从来都没有说0.999和0.99不是一个等级的,当然,其实严格来说0.99和0.999都很诡异,因为拟合的太好了,拟合的太好了往往就说明数据是有问题的,但既然你做实验,你也应该知道,检验是否有问题,看的主要不是拟合优度,而是显著性,我们有多大的把握在95%的水平上认为回归的显著的,这是关键,单单一个r方说服力不够

小悦立正向前走
引用 @恍如昨梦whu 发表的:
手欠算了下,拟合度99.96%……

你用三阶多项式拟合十个数据点 99.9% 很正常的结果。并不能说明作假啊

恍如昨梦whu
引用 @小悦立正向前走 发表的:
你用三阶多项式拟合十个数据点 99.9% 很正常的结果。并不能说明作假啊

99.9%并不是很正常的结果,三阶多项式你随便取十个点试一下就知道了。
而且人家微博po主成功预测了2019年的成交额啊,
说极端点,证个伪,你拿股市任意连续十天的收盘指数,也拟合不了后一天收盘指数

A
Admourwhy
引用 @女票胸大腰细 发表的:
你的逻辑好像有点问题 难道逻辑链不是:淘宝数据可以拟合→怀疑作假→根据公式预测下年数据→预测准确→涉嫌作假

没文化真可怕
这么点数据拟合出一条曲线很奇怪?
你给我五年人口数据我也能拟合出一条曲线信不
何况本来就是预先定好目标的,要调控不是轻轻松松?发个1000元红包你能不买?

你牛逼你上啊嘴贱
引用 @Jazyyyy 发表的:
你不会以为双十一没有指标吧?

我这里强调的是一天和一年。 意思很明显吧

欢天嘻地
引用 @一叶束水 发表的:
数据作假基本不可能,但是很明显天猫是内部定了自己的kpi,然后为了这个kpi在当天利用各种办法冲了数据。就像斗鱼主播冲榜,可能最后冲不上去了,工会大笔一挥帮你打了几个,确实主播没有得到那么多,但是数据也不算是假的。双十一当天看到kpi完不成了,就强迫继续打折,不允许下架等措施,最后冲击到可以完成的kpi收手。

是不是我可以利用退货规则,以及花呗额度,让一批员工各种买买买,然后12号再选择退货就好了,反正一分钱没花,还完成了所谓的“真实数据”,这难道不算数据造假吗??

流年不利12
引用 @恍如昨梦whu 发表的:
99.9%并不是很正常的结果,三阶多项式你随便取十个点试一下就知道了。
而且人家微博po主成功预测了2019年的成交额啊,
说极端点,证个伪,你拿股市任意连续十天的收盘指数,也拟合不了后一天收盘指数

正常的社会科学拟合优度不可能达到这个数字的

流年不利12
引用 @luyangg 发表的:
你说出这句话,就知道你不懂基本的统计与回归分析。按照以前双十一的数据点,二次多项式回归曲线有且只有一个最优解,都是经过数学模型最优化处理的,只要数据点一样,换100个人做回归曲线,结果都一样。

话说老哥会stata吗?问你几个问题

欢天嘻地
引用 @给取个拉风的昵称巴 发表的:
我也偏向于这种说法,先定的目标,然后各种方式去完成,目标怎么定,定多少,总归有套算法算出来,他们也知道单一天完成这个数字有多难,提前10天就开始搞预付,先初步估算最终金额能到多少,再中间不断加大促销力度,到昨晚再继续加放红包来促成这个目标金额

我想数据造假有好多种方式,一种后台直接调,只有最高层有权限那种,反正查不到,也不会有人查

一种是你说的定目标,然后通过手段去达到,手段也有很多种,宣传,折扣,吸引真实消费者,,,,要求商家签对赌协议,类似于电影票房,达不到自己补那种,然后商家自己再退货,,,,,或者利用员工或虚拟账号买东西,第二天退货就可以了。

无论哪种手段,这两种手段都是属于造假的

虎扑用户856650
引用 @恍如昨梦whu 发表的:
借用网友的一句话:

”你以为是对准靶子开枪,看看能不能10环

实际上是靶子和枪不断调整,确保一枪10环。”

这就是先制定销售指标,然后想方设法(最后几小时放券+折扣),完成kpi的玩法

但拟合程度这么高这种说法说不过去吧,这种设计目标动态调整是可以,但不可能这么准确的。不说往下波动能通过促销调整,如果往上波动,这拟合就绝对不会这么准确

大负翁
引用 @虎宝卡 发表的:
往年晚上九点十点左右会有回血红包,满额适用,今年没收到

有的啊...我收到了一个满1988减288...

L
Llllllllll1
引用 @你扣脚的样子好美 发表的:
高中是学过统计的

但凡学过高中数学都能理解,所以那个逗比连高中都没上过

罗斯甜瓜阿无敌
引用 @马机智 发表的:
层主按这个规律再算算明年的

这个数据如此准确。造假无疑了。我就说今年居然不去年涨这么多?

罗斯甜瓜阿无敌
引用内容被灭过多已被折叠

只要在双11结果出来钱的预测就是预测

罗斯甜瓜阿无敌
引用 @可别忘了初心吧 发表的:
去原微博看,已经删除了。

阿里找他了