引用 @晨风之刃 发表的: 给铁子们通俗的解释一下:就是淘宝近十年的销售数据完美拟合一个以年份为变量的方程。然后用这个方程预测去年和今年的销售额基本一致。 如果是自然搜集或者产生的数据不应该这么完美,所以推断淘宝对自己的销售额有修正或注水。
引用 @阿兹特克帝国 发表的:他说的挺有道理的,就是淘宝会提前拟订一个销售目标,让各大商家努力去完成,可能正常情况下完不成既定目标,然后淘宝就用各种方法,比如给一些品牌保证,如果完成多少销售额,下阶段会给你们增加多少流量就这样,各个品牌会用各种方法去完成这个任务,比如有些会返现的福袋等等
引用 @胡太帅帅 发表的:真就自变量只有5年也敢随便拟合呗。你这种就是典型的数据构成内在逻辑都确定不好,拿模型乱套。就5年数据,你就敢确定居然和年份之间是多项式线性关系。佛了,数据分析天才就是你吧。
引用 @万宗方 发表的:不愧为吹逼界的贴吧,专业
引用 @messiah1986 发表的: 我觉得这个比较有意义本身就是设定好让你在这一时间消费,再加上双十一前很大部分的定金冲抵,可以很明确地将已付定金消费剩余的尾款作为当晚的必然收入,增加数据的确定性总之我觉得水分可以接受,主要是产出的水分是不是会影响消费者或者是国家整体经济?
引用 @斯文叫花子 发表的:店铺完不成任务,然后靠刷单??? 需求可以刺激,可以创造... 但是真实的需求能根据企业的需求而被定制吗?
引用 @哈有趣 发表的:昨天晚上淘宝各大旗舰店突然上架了一批0元福袋标价一百到两千 收货后退款 明显是有销售额的指标
引用 @弄布灵清 发表的:恭喜你答对了 阿里是上市公司 如果数据造假可以申请索赔 可以去美国起诉了 否则 等帖子火了 等着收阿里法律部的律师信吧
引用 @晨风之刃 发表的: ...首先自变量有十一年,取出了两个最近的节点做回测...其次我只是在描述这组数据做回归拟合的很好...用了疑似而不是实锤... 这个R方确实有些离谱... 我也没做因果推断...没有强加因果...不知道您在喷我什么
引用 @洛杉矶湖人队魂 发表的:插眼 明年来看是不是3300亿
引用 @阿兹特克帝国 发表的:淘宝有专门和那些大店对接的小二,小二会给大店提出一些销售额的要求,能达到的话就给流量,所以为了流量,那些再🐮🍺的大品牌也会放下身子去完成淘宝小二下的任务。
引用 @0371糖爸 发表的:关键是4月份的时候有人发现了
引用 @麦牙套的火箭 发表的:r方0.99,真的🐮🍺嗷铁汁,不如再看看破百亿的用时是否也是这样的(ಡωಡ)
引用 @晨风之刃 发表的: 兄弟这是一个先验和后验的事情。 投资人确定增长函数是一个先验的事情,我们只能通过已有数据去估计这个函数(统计里叫做回归和参数估计),来确定这个函数。争议最大的点就是,正常来说,我们通过数据估计函数会有偏差,且偏差往往不小。但是这组数据过于完美,计算出R方接近于1(1是没有偏差)。
引用 @风中流泪 发表的: 有个瑕疵,就是样本太少,只有十个样本,很容易做到99的拟合度。如果是50个样本的回归,那就很有说服力了。
引用 @刚看篮球3 发表的: 投资人为什么恰好选择这个函数,或者说这个方程有啥特殊意义值得去满足吗
引用 @CLoUd℡ 发表的:投资人一般为非业内人士,以科学的模型去预测运营数据的。承诺股东投资人什么数据,或者说投资人想要什么样子的数据,企业自然就往这个目标去操作。
引用 @刚看篮球3 发表的: 不懂就问,为什么恰恰做到这个数据,这个数据对阿里的好处是啥?比如既然是作假,卫星放的更大一点不好吗?为啥要恰恰符合这个函数
引用 @樱杞花开 发表的: 还有一点其实很多人高估了这个难度。这个数据不是一下子出来的,双11有一整天的时间可以根据分时数据调整优惠策略为达到最终的KPI指标,比如中午比预期收入低了,那就分配几个大店加大优惠力度什么的。
引用 @微暗的小火 发表的:选线性回归模型时,低次方容易 underfitting(用直线拟合总是 underfitting),这种情况比较 R^2 才会越高越好。但高次方容易 overfitting,不能看 R^2 下结论,只能用测试数据验证(原则上所有模型如此)。
引用 @微暗的小火 发表的:能不能亮我上去
引用 @jiajianchengchu 发表的:你还想亮,知识学到不上不下的人是最有气势的,最能看透一切的。你这种还是好好学术,做做研究,然后接受大众在那些不上不下的人地引导下痛心疾首的批评。智力不行的人永远搞不懂用无根据的东西揭露骗局和用事实揭露骗局的有什么区别。
引用 @lebronzhao 发表的:所以逻辑就是模型拟合越完美,数据越假?二次模型拟合亚马逊销售额数据也是99%,规模经济自然增长有时候就这么巧合。人类从自然界“拟合”出这么多规律,难道世界是假的?
引用 @晨风之刃 发表的: 所以说可能是阿里内部以一定的方法论制定了销售额的kpi~然后再执行2333不过我们都是外人 企业内部的事情不得而知
引用 @Kalok 发表的: 这拟合度真的高,做实验的话得高兴坏了
引用 @巴拉之熊熊 发表的: 天猫淘宝的店铺的双11优惠活动在双11前早就确定了,怎么可能说变就变,每一笔优惠都需要公司老板或者总经理签批的,店铺运营的人了没这个权力,淘宝的人更没有,除非钱由淘宝补贴
引用 @骅哥带你飞 发表的: 作为统计学生,想借个楼对这个拟合度r²为0.99的问题发表一下自己的看法,其实美国黑色星期五在三次线性回归的情况下,也是基本完全拟合的。这说明什么了呢,当然并不是因为中美的数据都造假,而是因为在这种情况下,一定自然的增长曲线本来就是符合多项式曲线的,也即泰勒展开式所示——多项式函数分布可以近似一切函数分布。
无语了. 上面制定kpi 小二调配下面的商家 配合完成
请问什么地方数据无水分?
是的 这才是正确说法 包括其他平台 jd 销售额不够 小二让我赶快刷个几十万 小二有kpi 上面也有 跟着完成就行了 反正无成本
而且淘宝人这么傻??要改也不是这么简单的改法好吧。
先不说阿里那个,gdp确实是这样,去年前三季度经济还可以,第四季度就严查环保,如果差了一些对一些本来不合标的企业就放松一些了
...首先自变量有十一年,取出了两个最近的节点做回测...其次我只是在描述这组数据做回归拟合的很好...用了疑似而不是实锤... 这个R方确实有些离谱... 我也没做因果推断...没有强加因果...不知道您在喷我什么
造假这么途省事么 用个这么简单的方程?
店铺完不成任务,然后靠刷单???
需求可以刺激,可以创造...
但是真实的需求能根据企业的需求而被定制吗?
经常搞统计的就直到这个数据有多恐怖
所以我看这个知乎回答的第一反应的知乎被公关了
还有一点其实很多人高估了这个难度。这个数据不是一下子出来的,双11有一整天的时间可以根据分时数据调整优惠策略为达到最终的KPI指标,比如中午比预期收入低了,那就分配几个大店加大优惠力度什么的。
刷单占比,拼多多》》京东》淘宝,做电商的都懂这点
每个企业都要在天猫造假的 目的就是制造该企业的东西好的假象
我是做建材的
比如 木门 衣柜 橱柜 集成灶 瓷砖 各种电器 总之 双11 都会造假 都有任务 都必须完成
就是钱是真买了 也真的发货了 但其实货没有发 钱再转回来
这不是马云想不想的问题 是每个企业都想的结果 然后大肆的在朋友圈宣传该企业多么牛比 [ 此帖被四分之三在2019-11-12 20:22修改 ]
事实就是这样子,如果明年是3300亿 结果实际做到了3200亿的话 当天晚上天猫小二是绝对会给各大旗舰店下多一次销售额目标,强行做到3300亿的,说造假也不太对,但是确实是可以人为操控大概金额的吧!当然要是3300亿只做到了两千亿,剩下这一千多亿阿里在如何介入操控怕都是无力回天!
放心,收律师信还轮不到虎扑,这个新闻你以为是虎扑原创?微博早就炸锅了,热搜一直压着而已
个人认为,这个数据这样做没有太大的统计学意义,样本量太少。
明年3300淘宝就是傻
今年的实际交易额是2684,已经完成了预测了
所以他们的完成匹配率是99%以上,你想想怎么可能
有个瑕疵,就是样本太少,只有十个样本,很容易做到99的拟合度。
如果是50个样本的回归,那就很有说服力了。
今年天猫的优惠力度真的太一般了吧,搞得什么吊盖楼活动,我看很多人都在玩那个,还有为了凑单有多少退货的,实际的数据要打多少回扣,不过这些无非也是商家和消费者倒霉罢了,淘宝该赚还是赚。
作为统计学生,想借个楼对这个拟合度r²为0.99的问题发表一下自己的看法,其实美国黑色星期五在三次线性回归的情况下,也是基本完全拟合的。这说明什么了呢,当然并不是因为中美的数据都造假,而是因为在这种情况下,一定自然的增长曲线本来就是符合多项式曲线的,也即泰勒展开式所示——多项式函数分布可以近似一切函数分布。
看起来是同行,r+第一年学的统计方法hhh
但是我说实话拟合数据的人但凡有点水平也不该用这么小的random variance……不说用个非正态的起码方差也该大一点……但是话又说回来方差大了容易出现不理想数据……
大公司这种定目标想尽办法达到的很正常,光从backtest是不能得出数据造假或者修正的结论的,也有可能是阿里的执行能力就是很强或者一个点凑巧了。更严格一点的分析应该是把当年第四季度的财报收入也拿出来做拟合,如果误差相差很大的话才能证明数据作假。
为什么阿里做这个函数的时候不加点随机项...
这么正好的吻合人家质疑一下又怎么了?也是真实的啊 咋就律师信?这么大公司还怕虎扑老哥跑数据?
明年改也不是,不改也不是了。。。
2060还有没有淘宝是个问题
阿里是上市公司,股东有很多。上市公司不可以和单一或者多个股东签署对赌协议。所以如果是投资人要求,公告里是可以看到的。反过来讲,阿里符合增长函数,倒是对增长函数的又一次印证,说明数学家在观察世界时模型的准确性。
虽然只有十个样本,但是别人只用了二次多项式就可以达到0.99还是挺离谱的
明年换公式了
你这么说我就懂了,今年参与了某项目,正常统计结果是八百多,上面领导要求上一千,后来干到1003了。
不用注水,本来就是淘宝的目标往上面靠就行了,修改数据没有任何意义
牛皮不能吹太大,不然下一年怎么吹?
天猫淘宝的店铺的双11优惠活动在双11前早就确定了,怎么可能说变就变,每一笔优惠都需要公司老板或者总经理签批的,店铺运营的人了没这个权力,淘宝的人更没有,除非钱由淘宝补贴
选线性回归模型时,低次方容易 underfitting(用直线拟合总是 underfitting),这种情况比较 R^2 才会越高越好。但高次方容易 overfitting,不能看 R^2 下结论,只能用测试数据验证(原则上所有模型如此)。
能不能亮我上去
针对“网友质疑天猫双11数据造假”一事,天猫相关负责人回应称,“按照网友的逻辑,符合统计趋势的就是假的。那么,世界经济总量也是能被预测的,经济发展也是假的吗?自己YY下满足自嗨就算了,由此得出天猫双11数据造假,就是造谣了哦,要负法律责任的!”
今日,天猫发言人官博再次回应称,已就这则谣言启动司法流程,希望再没有这样侮辱大家智商的“智商测试”。(新浪科技/每日经济新闻)
不单单是淘宝,京东也一样。
你还想亮,知识学到不上不下的人是最有气势的,最能看透一切的。
你这种还是好好学术,做做研究,然后接受大众在那些不上不下的人地引导下痛心疾首的批评。
智力不行的人永远搞不懂用无根据的东西揭露骗局和用事实揭露骗局的有什么区别。
2333 这只是一个二次方的回归呀 而且因为数据真的不多 拿出了两年的数据做回测 可以翻一下我的回复记录 正常这样的数据量是没法做支撑和判据的 所有我也没有做casual inference.只是说疑似 和贴合的太完美了//数据有点完美的不真实
智力不行真的是好大的帽子...
陈述现实中一组数据完美的过分....就被被您喷了
我也承认了这个数据没法做任何推断 只是觉得有些诡异...
好大的口气先手批评教育...
况且T大也不至于给您俯瞰一切觉得其他人都是憨憨的勇气吧......况且也并非真的有天大的智力gap
理性讨论...
所以说可能是阿里内部以一定的方法论制定了销售额的kpi~然后再执行2333
不过我们都是外人 企业内部的事情不得而知
可以这么给外行解释R方,比如我没说阿里肯定造假,我只是用数据证明了阿里有99.93%的可能性造假。🐶
被打脸了就别嘴硬。
而且不是百分之百而是99.94%,作为对于有些学科,这个作为实验结果那这篇SCI很可能稳了,当然对于还有一些学科,这个数据可能因为过于好看受到审稿人的质疑
因为事先确定增长率,然后再用数据拟合。这个前定的“增长率”多半跟股权回报有关,上市公司最重视的东西
什么几把都律师信,你以为律师信那么好发?且不说人家通篇文章引用历史真实数据做出来的模型得出一个合理的结论,并不是胡编乱造的。再者你当阿里傻吗?这时候发律师信,不就证明了心虚了?偌大的阿里巴巴,如果公关部就这水平,说出来谁信?
这不简单?每个时段都有一批优惠券抽奖,放多点优惠券出来不就行了
只是都想弄的稳定增长罢了
第二,销售额是一个很大的数字,他的年度增长率,会随着销售额的增加,越来越稳定。类似的现象也发生在,例如,GDP,人口总数增长等场景。任何统计数据,只要他越来越大,他的变化率就会越来越稳定。否则这个世界就要爆炸了。很大的绝对数,相对稳定的增长率,让绝对数看起来很有规矩。
第三,一个更好的,看这个数据的方法是看年度增长率。纯技术角度讲,这样的时间序列数据更可能平稳。增长率也有很好的实际业务含义。从增长率看,尤其是最近五年的年度增长率。淘宝销售额的年度增长率,稳步下降,略有起伏,正常得不能再正常。
第四,如果,淘宝销售额,在这么大的体量下,起伏波动很大,那倒是奇了怪,那才值得关注,那一定出问题了。