淘宝双十一数据疑似造假?

查看虎扑今日新帖
最新回复:2019年11月13日 10点15分 PT
共 (184) 楼
虎扑用户680301
楼主 (虎扑)
在朋友圈看到有人转淘宝双十一数据疑似注水 原图在第一张图片里P1 自己用R跑了一下 在下面的几幅图里 最后一张是用excel画的预测以及置信上下限 结论是啥不用我多说了吧 这个图跑的真的完美...为了防止过度拟合 我拿去年和今年的数据出来做预测...完美卡在置信区间里面 还真是个R方0.9993的多项式 (单变量多项式回归做现实数据这么完好拟合,不用我多说了8⃣️)

 

🔥 最新回帖

虎扑用户607470
184 楼
第一,样本量很小,只有10个样本。而一个三次回归分析模型就有4个参数。因此,拟合优度就不会太差。十年?似乎是一个好长的时间,但是,这是年度数据,也就10个数而已。

第二,销售额是一个很大的数字,他的年度增长率,会随着销售额的增加,越来越稳定。类似的现象也发生在,例如,GDP,人口总数增长等场景。任何统计数据,只要他越来越大,他的变化率就会越来越稳定。否则这个世界就要爆炸了。很大的绝对数,相对稳定的增长率,让绝对数看起来很有规矩。

第三,一个更好的,看这个数据的方法是看年度增长率。纯技术角度讲,这样的时间序列数据更可能平稳。增长率也有很好的实际业务含义。从增长率看,尤其是最近五年的年度增长率。淘宝销售额的年度增长率,稳步下降,略有起伏,正常得不能再正常。

第四,如果,淘宝销售额,在这么大的体量下,起伏波动很大,那倒是奇了怪,那才值得关注,那一定出问题了。

街上的
183 楼
都没学过吗?这种增长式的曲线找个参数拟合不是很简单吗?这有什么问题吗?

虎扑用户652303
182 楼
引用 @骅哥带你飞 发表的:
作为统计学生,想借个楼对这个拟合度r²为0.99的问题发表一下自己的看法,其实美国黑色星期五在三次线性回归的情况下,也是基本完全拟合的。这说明什么了呢,当然并不是因为中美的数据都造假,而是因为在这种情况下,一定自然的增长曲线本来就是符合多项式曲线的,也即泰勒展开式所示——多项式函数分布可以近似一切函数分布。

只是都想弄的稳定增长罢了

八毛钱买宝马
181 楼
引用 @巴拉之熊熊 发表的:
天猫淘宝的店铺的双11优惠活动在双11前早就确定了,怎么可能说变就变,每一笔优惠都需要公司老板或者总经理签批的,店铺运营的人了没这个权力,淘宝的人更没有,除非钱由淘宝补贴

这不简单?每个时段都有一批优惠券抽奖,放多点优惠券出来不就行了

八毛钱买宝马
180 楼
引用 @弄布灵清 发表的:
恭喜你答对了 阿里是上市公司 如果数据造假可以申请索赔 可以去美国起诉了 否则 等帖子火了 等着收阿里法律部的律师信吧

什么几把都律师信,你以为律师信那么好发?且不说人家通篇文章引用历史真实数据做出来的模型得出一个合理的结论,并不是胡编乱造的。再者你当阿里傻吗?这时候发律师信,不就证明了心虚了?偌大的阿里巴巴,如果公关部就这水平,说出来谁信?

 

🛋️ 沙发板凳

带带阿拉川
标题能看懂,但内容超出了我的认知范围

虎扑用户680301
给铁子们通俗的解释一下:就是淘宝近十年的销售数据完美拟合一个以年份为变量的方程。然后用这个方程预测去年和今年的销售额基本一致。 如果是自然搜集或者产生的数据不应该这么完美,所以推断淘宝对自己的销售额有修正或注水。

麦牙套的火箭
引用 @晨风之刃 发表的:
给铁子们通俗的解释一下:就是淘宝近十年的销售数据完美拟合一个以年份为变量的方程。然后用这个方程预测去年和今年的销售额基本一致。 如果是自然搜集或者产生的数据不应该这么完美,所以推断淘宝对自己的销售额有修正或注水。

r方0.99,真的🐮🍺嗷铁汁,不如再看看破百亿的用时是否也是这样的(ಡωಡ)

氢氧化钠NaOH
反正从我身边的朋友和同事来看,今年双十一远没有去年热闹,坐标合肥

洛杉矶湖人队魂
插眼 明年来看是不是3300亿
苏酌寒
确实,数据准的有点离谱

库里骑扣时说
r方零点9993给我整懵了 梦寐以求的数据

简约明天
对8起,看8懂

恍如昨梦whu
引用 @带带阿拉川 发表的:
标题能看懂,但内容超出了我的认知范围

用Excel直接拉预测曲线(可百度,2分钟即可复盘),自动算拟合度

手欠算了下,拟合度99.96%……

恍如昨梦whu
引用 @麦牙套的火箭 发表的:
r方0.99,真的🐮🍺嗷铁汁,不如再看看破百亿的用时是否也是这样的(ಡωಡ)

99%是基操,去了一半年份数据都有99.76%

但是全算上就是99.96%拟合度了🐶🐶

h
hongkaiy
这么一提确实很可疑。多搞几条数据,看看会不会这么巧合,比如物流企业的增长,按道理物流是类似的曲线才对,能不能搞到数据?
发帖会常务副主任
有点东西
大吻秋刀鱼
引用 @洛杉矶湖人队魂 发表的:
插眼 明年来看是不是3300亿

因为这个帖子 明年3500亿
w
wumyl26
插眼,明年见
牧牧中无人
这个帖子会火,前排占位,哈哈哈
z
zwyrz
就是数据增长和曲线太符合,太完美,所以给人感觉不真实
虎扑用户576098
投资人一般为非业内人士,以科学的模型去预测运营数据的。承诺股东投资人什么数据,或者说投资人想要什么样子的数据,企业自然就往这个目标去操作。
虎扑用户423974
引用 @大吻秋刀鱼 发表的:
因为这个帖子 明年3500亿

每年都有质疑的,有什么所谓呢?

1
16岁上空姐
可以,在美帝可能被集体诉讼了。

达拉斯巨星银角大王
引用 @氢氧化钠NaOH 发表的:
反正从我身边的朋友和同事来看,今年双十一远没有去年热闹,坐标合肥

朋友圈以前年年都有晒单炫富啥的,今年竟一个没有

2
28号乔神
京东数据倒是很假

h
hongshaorou
一半都是福袋刷的流水,今年10万一个福袋都出来了

K
Kalok
这拟合度真的高,做实验的话得高兴坏了

L
Ljamesw
还真是

阿民被注册了
引用 @达拉斯巨星银角大王 发表的:
朋友圈以前年年都有晒单炫富啥的,今年竟一个没有

肉都吃不起了,还炫啥。

二笙粉
细思极恐。。。。。。。。
虎扑用户964056
阿里另一个平台1688 年中大促的时候,类似于某宝的双十一 是一年中最大的活动。阿里小二都直接给我们下任务的 要刷多少金额 ,都懂的,刷就完事了。更可笑的是,平时刷单他还要来抓你 哈哈。
东南亚影魔
我感觉周围的人越是经济不景气越注意促销节花钱 如果钱包很足可能是实体购买多一些 所以增长可以理解 但是lz说的看不太懂 可以理解为增长率太稳健了么

海啸兄弟发威吧
引用 @晨风之刃 发表的:
给铁子们通俗的解释一下:就是淘宝近十年的销售数据完美拟合一个以年份为变量的方程。然后用这个方程预测去年和今年的销售额基本一致。 如果是自然搜集或者产生的数据不应该这么完美,所以推断淘宝对自己的销售额有修正或注水。

哈哈哈,高中数学选修的统计案例里就讲过了,回归方程,高考可以考哒。
W
Wenyajerry
可以用ggplot2么。。。R画图第一反应

喝点酒就飘了
不懂就问
这种数据水分 说白了就是吹牛逼呗
会对有的人的利益产生影响吗?
0
0371糖爸
引用 @晨风之刃 发表的:
给铁子们通俗的解释一下:就是淘宝近十年的销售数据完美拟合一个以年份为变量的方程。然后用这个方程预测去年和今年的销售额基本一致。 如果是自然搜集或者产生的数据不应该这么完美,所以推断淘宝对自己的销售额有修正或注水。

关键是4月份的时候有人发现了

蓉蓉姐姐
作假是肯定要的。但是不需要阿里自己做。商家会帮着做,阿里也乐见其成
蓉蓉姐姐
引用 @喝点酒就飘了 发表的:
不懂就问
这种数据水分 说白了就是吹牛逼呗
会对有的人的利益产生影响吗?

收益最大是阿里本身,还有已经上市的商家,需要融资的商家。。。
B
BBoy蓝牙
这个我不知道,反正那个双十一个人战绩就是假的,我同事就买了一两百,排名都比我高。可想而知就知道是假的了
马克不要蓝
贴一个知乎回答,兼听则明

任性的自行车
r方0.99倒立裸奔,自己回归r方能有0.7都烧高香了

积极挤鸡鸡
有点秀

手撕辣子鸡
引用 @氢氧化钠NaOH 发表的:
反正从我身边的朋友和同事来看,今年双十一远没有去年热闹,坐标合肥

能抢的东西都被人用机器人抢完了,还买个毛啊

虎扑用户874214


m
messiah1986
引用内容由于违规已被删除

我觉得这个比较有意义
本身就是设定好让你在这一时间消费,再加上双十一前很大部分的定金冲抵,可以很明确地将已付定金消费剩余的尾款作为当晚的必然收入,增加数据的确定性
总之我觉得水分可以接受,主要是产出的水分是不是会影响消费者或者是国家整体经济?

邓肯是个好控卫
引用 @恍如昨梦whu 发表的:
用Excel直接拉预测曲线(可百度,2分钟即可复盘),自动算拟合度

手欠算了下,拟合度99.96%……

你到底是多欠,每个帖子都刷一下

我黑个
拟合度高很正常,毕竟点数少次方高,关键是用之前的拟合结果算出现在年份的值,与实际差的不多,感觉有点问题
恍如昨梦whu
引用内容可能违规暂时被隐藏

老兄平时说话都这么暴躁的吗?

工作站死机了重启中,无聊拿另一台笔记本算一下,刷刷屏不行吗

刚看篮球3
引用 @晨风之刃 发表的:
给铁子们通俗的解释一下:就是淘宝近十年的销售数据完美拟合一个以年份为变量的方程。然后用这个方程预测去年和今年的销售额基本一致。 如果是自然搜集或者产生的数据不应该这么完美,所以推断淘宝对自己的销售额有修正或注水。

不懂就问,为什么恰恰做到这个数据,这个数据对阿里的好处是啥?比如既然是作假,卫星放的更大一点不好吗?为啥要恰恰符合这个函数

2
24K纯帅得不明显
插眼

刚看篮球3
引用 @CLoUd℡ 发表的:
投资人一般为非业内人士,以科学的模型去预测运营数据的。承诺股东投资人什么数据,或者说投资人想要什么样子的数据,企业自然就往这个目标去操作。

投资人为什么恰好选择这个函数,或者说这个方程有啥特殊意义值得去满足吗

刚看篮球3
引用 @hongshaorou 发表的:
一半都是福袋刷的流水,今年10万一个福袋都出来了

福袋是什么东西


虎扑用户863053
数据量太少了吧,而且每年统计口径可能不太一样,再过个二十年多拿几种模型试一下,或者你尝试用分时段的数据试一下

恍如昨梦whu
引用 @刚看篮球3 发表的:
福袋是什么东西

类似nike的闷包,99/199随便定一个价,里面随机发一些东西,其实就是清仓,有良心的福袋,会允许你指定一下鞋子衣服的尺码

p
pepper_220
引用 @晨风之刃 发表的:
给铁子们通俗的解释一下:就是淘宝近十年的销售数据完美拟合一个以年份为变量的方程。然后用这个方程预测去年和今年的销售额基本一致。 如果是自然搜集或者产生的数据不应该这么完美,所以推断淘宝对自己的销售额有修正或注水。

哪个数字不是假的?

哈有趣
引用 @晨风之刃 发表的:
给铁子们通俗的解释一下:就是淘宝近十年的销售数据完美拟合一个以年份为变量的方程。然后用这个方程预测去年和今年的销售额基本一致。 如果是自然搜集或者产生的数据不应该这么完美,所以推断淘宝对自己的销售额有修正或注水。

昨天晚上淘宝各大旗舰店突然上架了一批0元福袋标价一百到两千 收货后退款 明显是有销售额的指标

滑水小泥鳅
引用 @氢氧化钠NaOH 发表的:
反正从我身边的朋友和同事来看,今年双十一远没有去年热闹,坐标合肥

而且今年快递也比去年快了,去年也是预售,负责我们公司的顺丰小哥说根本没去年忙

无人防守也后仰
引用内容由于违规已被删除

我也觉得奇怪,如果是造假,为何非得按这个公式造假?这种级别的公司,要造假的话能这么简单让吃瓜群众发现?我要是马云,直接说比去年多个200亿300亿之类的不就行了

虎扑用户476071
铁汁nb

你瘦了
明年多少,预测结果

F
Flooooooor
引用 @Ouchhhh 发表的:
每年都有质疑的,有什么所谓呢?

上市公司要为市值负责啊

h
hongshaorou
引用 @刚看篮球3 发表的:
福袋是什么东西

一双袜子卖9999元,到货退全款。一瓶化妆水卖1万,到货退全款。销售额蹭蹭蹭的上去了

k
kofans
今年双十一我老婆丈母娘小姨子们都没剁手,数据还升高了……

d
ddbcwhbq
引用 @刚看篮球3 发表的:
不懂就问,为什么恰恰做到这个数据,这个数据对阿里的好处是啥?比如既然是作假,卫星放的更大一点不好吗?为啥要恰恰符合这个函数

用这个函数修正的当然符合这个函数

P
PeterPei
引用 @CLoUd℡ 发表的:
投资人一般为非业内人士,以科学的模型去预测运营数据的。承诺股东投资人什么数据,或者说投资人想要什么样子的数据,企业自然就往这个目标去操作。

kpi要求的。。。

k
kobelovefgj
引用 @库里骑扣时说 发表的:
r方零点9993给我整懵了 梦寐以求的数据

too good to be true
虎扑用户680301
引用 @caicai98 发表的:
数据量太少了吧,而且每年统计口径可能不太一样,再过个二十年多拿几种模型试一下,或者你尝试用分时段的数据试一下

兄弟说的有道理 数据源我确认过了 是官方的统计数据~ 这个模型有待观察 不过从现有的东西看 有些诡异

u
ueelove
销售数据假的要死,还真有人信这种数据。
虎扑用户680301
引用 @无人防守也后仰 发表的:
我也觉得奇怪,如果是造假,为何非得按这个公式造假?这种级别的公司,要造假的话能这么简单让吃瓜群众发现?我要是马云,直接说比去年多个200亿300亿之类的不就行了

应该是内部可能对销售额有一个类似这样的增长函数的要求和预测 所以才会让销售额向这个方向修正。不过上面说的只是一种假设,如果要判断可能要做因果推断。

虎扑用户680301
引用 @麦牙套的火箭 发表的:
r方0.99,真的🐮🍺嗷铁汁,不如再看看破百亿的用时是否也是这样的(ಡωಡ)

等有空的 多搜集一些数据 再试试

库里骑扣时说
引用 @kobelovefgj 发表的:
too good to be true

不过说实话样本太少没有统计意义 但2684落在二次多项式和三次多项式的估计值之间就有点牛逼了

虎扑用户115293
很正常吧,目标这样订的,而且我估计以后估计拟合度会下降,因为今年先预定,11号付尾款这种操作都出来了,说明业务增长跟不上目标了

迷路的查理
引用 @洛杉矶湖人队魂 发表的:
插眼 明年来看是不是3300亿

别说了
马上改参数~

虎扑用户680301
引用 @库里骑扣时说 发表的:
不过说实话样本太少没有统计意义 但2684落在二次多项式和三次多项式的估计值之间就有点牛逼了

嗯嗯。就是落得太完美了 所以这大兄弟说的很有道理 too go to be true

弄布灵清
引用 @晨风之刃 发表的:
给铁子们通俗的解释一下:就是淘宝近十年的销售数据完美拟合一个以年份为变量的方程。然后用这个方程预测去年和今年的销售额基本一致。 如果是自然搜集或者产生的数据不应该这么完美,所以推断淘宝对自己的销售额有修正或注水。

恭喜你答对了 阿里是上市公司 如果数据造假可以申请索赔 可以去美国起诉了 否则 等帖子火了 等着收阿里法律部的律师信吧

迷路的查理
话说jd怎么样?
是不是也有规律的?

等一只猫
不走心啊

保罗下儿子上
假的不能再假,按照日益增长的公司发展,就应该符合这个趋势,你不能用随意的自然数去和它比较吧~想要拟合它的数据,不知道要考虑多少边界条件~岂是你画两张图就推算出来的

虎扑用户680301
引用 @喝点酒就飘了 发表的:
不懂就问
这种数据水分 说白了就是吹牛逼呗
会对有的人的利益产生影响吗?

销售数据会产生现金流,现金流对公司估值起到重要影响。结合最近阿里可能要再次上市,以及公司估值对股价的影响。销售额注水确实有很高的正收益

虎扑用户680301
引用 @刚看篮球3 发表的:
投资人为什么恰好选择这个函数,或者说这个方程有啥特殊意义值得去满足吗

兄弟这是一个先验和后验的事情。 投资人确定增长函数是一个先验的事情,我们只能通过已有数据去估计这个函数(统计里叫做回归和参数估计),来确定这个函数。争议最大的点就是,正常来说,我们通过数据估计函数会有偏差,且偏差往往不小。但是这组数据过于完美,计算出R方接近于1(1是没有偏差)。

烂怂大雁塔
引用 @晨风之刃 发表的:
给铁子们通俗的解释一下:就是淘宝近十年的销售数据完美拟合一个以年份为变量的方程。然后用这个方程预测去年和今年的销售额基本一致。 如果是自然搜集或者产生的数据不应该这么完美,所以推断淘宝对自己的销售额有修正或注水。

这没什么奇怪的吧,可能阿里领导给下面人定的目标销售额,为了业绩想各种营销办法也要完成目标产值吧。阿里如果做假账的话,后果是很严重的。我个人倾向于有水分,但是大差不差

h
hector_aries
建议拿2009年-2018年美国的零售总额、中国国家统计局给出的1999年-2018零售总额数据拟合一下。应该也是99.9以上
阿兹特克帝国
引用 @哈有趣 发表的:
昨天晚上淘宝各大旗舰店突然上架了一批0元福袋标价一百到两千 收货后退款 明显是有销售额的指标

淘宝有专门和那些大店对接的小二,小二会给大店提出一些销售额的要求,能达到的话就给流量,所以为了流量,那些再🐮🍺的大品牌也会放下身子去完成淘宝小二下的任务。

虎扑用户470901
想要高估值呢?

阿兹特克帝国
引用内容由于违规已被删除

他说的挺有道理的,就是淘宝会提前拟订一个销售目标,让各大商家努力去完成,可能正常情况下完不成既定目标,然后淘宝就用各种方法,比如给一些品牌保证,如果完成多少销售额,下阶段会给你们增加多少流量就这样,各个品牌会用各种方法去完成这个任务,比如有些会返现的福袋等等

虎扑用户680301
引用 @阿兹特克帝国 发表的:
他说的挺有道理的,就是淘宝会提前拟订一个销售目标,让各大商家努力去完成,可能正常情况下完不成既定目标,然后淘宝就用各种方法,比如给一些品牌保证,如果完成多少销售额,下阶段会给你们增加多少流量就这样,各个品牌会用各种方法去完成这个任务,比如有些会返现的福袋等等

感谢兄弟 学到了

吉林东北虎总冠军
引用 @带带阿拉川 发表的:
标题能看懂,但内容超出了我的认知范围

这内容你都看不懂?我根本就没看!

我为什么
引用 @洛杉矶湖人队魂 发表的:
插眼 明年来看是不是3300亿

是也说明不了什么

阿兹特克帝国
引用 @晨风之刃 发表的:
感谢兄弟 学到了

天猫店刷单都很少抓,就是因为淘宝要数据撑排面吹🐮🍺,商家要完成淘宝小二给的销售额任务,各取所需,官方睁一只眼闭一只眼,数据上的任务达到了也就停了,所以销售额才会这么准,希望有一天潮水会褪去

喵贼白
引用 @晨风之刃 发表的:
给铁子们通俗的解释一下:就是淘宝近十年的销售数据完美拟合一个以年份为变量的方程。然后用这个方程预测去年和今年的销售额基本一致。 如果是自然搜集或者产生的数据不应该这么完美,所以推断淘宝对自己的销售额有修正或注水。

这残差就是个0啊,太神奇了

我的昵称真的好难取
引用内容由于违规已被删除

其实很简单,就算像知乎上这个说的,有任务目标就去完成,所以啊,有刷单也就是作假嘛

B
BoomSwag
引用 @弄布灵清 发表的:
恭喜你答对了 阿里是上市公司 如果数据造假可以申请索赔 可以去美国起诉了 否则 等帖子火了 等着收阿里法律部的律师信吧

人家楼主拿数据说话,不知道你在这酸什么。

第负三十四次的方程
哎,没有可拟合的曲线才是怪事,正是因为宏观经济表现是有规律所以可预测的,才发展了宏观经济学

计小蓝
这种纳斯达克上市的公司,全球知名的企业,数据造假?

如果是真的,被扒出来,市值要蒸发多少?

为了一个曲线图的好看,不顾公司形象?这笔账马云不会算吗?

虎扑用户680301
引用 @第负三十四次的方程 发表的:
哎,没有可拟合的曲线才是怪事,正是因为宏观经济表现是有规律所以可预测的,才发展了宏观经济学

有曲线是没问题的 但是经济学模型的r方过0.4就已经很不错很不错了//何况这个是一个单变量多项式回归,没有加入无关变量导致R方增加的问题//R方0.9993的模型在现实中存在这个事情太诡异了

l
levart
刚在微博上看到一种说法

万宗方
引用内容由于违规已被删除

不愧为吹逼界的贴吧,专业

小强89
我挺高兴,咱们的水平提高了,去年还没人提方程式呢,我相信我们一定会越来越强大

Z
ZeronQAQ
引用 @刚看篮球3 发表的:
不懂就问,为什么恰恰做到这个数据,这个数据对阿里的好处是啥?比如既然是作假,卫星放的更大一点不好吗?为啥要恰恰符合这个函数

因为不一定是作假 可能是控制 可以看看这条微博
https://m.weibo.cn/1560906700/4437781868668518

灵宫迅音
引用内容由于违规已被删除

GDP的数据,是先定目标再努力去完成,每年8%很正常

j
jinghongtianxia
学习了,下来自己试一试。