其实删掉红色部分,基本也差不离。。 “看到有个老黑在youtube上教excel也自称数据科学家,你说呢?” anye 发表于 2022-11-10 22:23
统计学的存在是小样本时代,ds的出现是大数据时代,ds必须要有处理大数据的能力,这一套系统都是在hadoop上,所以跨cs,需要编程过硬。如果ds还是在做小样本数据自然是做不过原统计专业了 问一个简单的问题,p -value在多少数据范围内有效?大数据为什么很少用到统计里的各种testing? weiweide 发表于 2022-11-11 14:30
这次好几个厂DS都是重灾区啊 weiweide 发表于 2022-11-10 16:32
DS按说门槛挺高的。我记得以前大厂都是phd做ds吧?fibril 发表于 2022-11-10 16:51
我司的ds leader是伯克利统计专业毕业生,带了俩工程师家属ds,一个是保险转的,一个是精算转的。他直接说:带不动,两人啥也不会。 nomorewaiting 发表于 2022-11-10 16:49
为什么用excel suixin111 发表于 2022-11-10 16:46
本来就是吹过头的专业。 informatica 发表于 2022-11-10 17:25
大厂里面有research/applied scientist 工资比ds高。小厂里都叫ds 不细分wfmlover 发表于 2022-11-10 17:55
DS的种类太多了,这个title 涵盖面特别广,技能差别也特别大。不好一概而论。 大喜妞 发表于 2022-11-10 17:50
谁能解释一下DS 到底是干什么的 awesomeiris 发表于 2022-11-10 18:38
看行业。meta这种ds都不是核心部门,更多是帮助做决定,当然是没有sde重要。但有些做分析的公司ds还是很重要的,裁不到ds头上,但这种ds更像是传统做行业分析的公司。 sandyud 发表于 2022-11-10 18:51
速成ds的问题是,只会调包,不明白背后的统计/ml 原理,经常乱做,错了都不知道。 jenniezz 发表于 2022-11-10 18:12
meta这次是保ds而解雇了很多sde 可能是要搞元宇宙吧 eragshs 发表于 2022-11-10 19:02
博士期间做了各种model, 每次外系导师都告诉我,去保险公司无脑做回归,一年10几万 superaloha 发表于 2022-11-10 18:55
做回归是什么意思? BlueMountains 发表于 2022-11-10 19:52
大厂里很多applied scientist 就是ds COA 发表于 2022-11-10 18:00
Ds 不都是phd 吗?xiazheteng 发表于 2022-11-10 20:37
生化环材,机械土木phd都可以做DS heydaymint 发表于 2022-11-10 20:41
是有很多真真懂的人比如统计系phd ,但名声被很多很水胡乱转专业的人给带坏了。转了专业的还算下功夫了。很多真的就是莫名其妙的背景就去做ds了。 公用马甲43 发表于 2022-11-10 21:11
我面试 DS 主要问两大类问题,能够把 PCA 解释清楚的或者能够把 MCMC 解释清楚的,随便解释清楚一个地都可以考虑,两个都解释清楚的是 strong hire, 一个都没听说过或者解释不清的直接闲聊天,从来不问脑筋急转弯比如估算天上有多少飞机这种傻冒问题 facet 发表于 2022-11-10 20:40
为ds正名。什么行业都有真正学懂和混的人。xmv 发表于 2022-11-10 20:53
Re。绝大多数applied scientist基本就是data scientist换个名字 heydaymint 发表于 2022-11-10 20:20
踩ds是为了啥,明明工资不及sde高了,title好不好听,都是虚的 只会调包?sde也是stackoverflow上面copy & paste 而且,对于公司而言,管你用啥模型,能够解决问题就行,调参数能够把模型调好、业绩上去,也就是本事 回归DS的工作性质,本身不是为了显摆machine learning水平有多高(你行你上啊,去deepmind,google research啊) 而是解析日常的business data,对business的理解,要远远比对ML的理解重要 公司业务好的时候是网红,不好的时候当然就没data可以分析了 wfmlover 发表于 2022-11-10 21:45
上线很高 下线很低 鱼龙混杂 badgerbadger 发表于 2022-11-10 18:14
这几年一大堆没法转码的转DS啊, 本科生master大家都是数据科学家。 不过我们公司貌似一直都要求DS必须是phd。 中美律师集团 发表于 2022-11-10 22:01
泡沫太大了吧 只会拉excel 的人都自称数据科学家 momo2008 发表于 2022-11-10 16:34
这行是伪科学吧 和高中写给材料作文没什么区别 一份数据可以根据需要分析出完全不同的结果 tekkamanz 发表于 2022-11-10 16:38
看到有个老黑在youtube上教excel也自称数据科学家,你说呢? nicecool 发表于 2022-11-10 16:39
太对了!所以data backed conclusion这件事也就听听就好了。 Redshoe 发表于 2022-11-10 22:14
真的?其实我也觉得奇怪,上回和一个DS work,就是那种你要一定先把data给他format成什么样的格式我他才能用。我说算了 我自己来吧,不然他也给我解释不了output是啥意思。但是好的又domain expertise的DS应该很有用的。 Redshoe 发表于 2022-11-10 22:13
data格式的问题可以理解,工作忙起来真没时间一个一个去整理格式。同类data,标准格式会有效率很多。 greentea2010 发表于 2022-11-10 22:24
DS就是对科学家这个词的侮辱。MGZH7 发表于 2022-11-10 22:30
我们data格式都是统一的,是他自己的软件不能take,他不理解data也不知道怎么改。 我的结论其实就是做啥最好都有domain knowledge才行。Google 做go 也还要和围棋高手一起work才行是吧。 Redshoe 发表于 2022-11-10 22:34
美国随便干啥都叫科学家。我看小朋友的定义挺好,不捣鼓试管的都不是科学家哈哈。 Redshoe 发表于 2022-11-10 22:35
不能自己写算法,做优化的调包侠都是扯淡。 democrap 发表于 2022-11-10 23:20
Data Scientist的核心是Scientist 好的数据分析师,不一定需要“大数据”,fancy 算法。若干个数据点,几个现成function,就能发现pattern,知道下一步如何处理了。 一句话总结下,没有good taste,干不了DS。。。 crazymutt 发表于 2022-11-10 17:26
apple店里的导购还叫genius呢,ds为啥不能叫科学家 nomorewaiting 发表于 2022-11-10 22:42
DS只是分析生产力结果。swe才是生产力。其实你分析不分析,结果都在那里。要是没生产力,你没有东西可分析。DS分析了的结果虽然之后可以指导生产力用力方向,但是市场不好的情况下,当然先裁掉DSYourdad 发表于 2022-11-11 01:28
回复 53楼facet的帖子 额高人给解释解释PCA和MCMC吧 icyhui 发表于 2022-11-10 23:10
🔥 最新回帖
样本大 p value 小
哈哈是的,这里的关键字是老黑,跟excel没关系,这个锅excel可不背。老黑就算是教两位数加法也可以自称是DS。
所以药厂还是需要统计的 小样本情况多 比如clinical trial
🛋️ 沙发板凳
泡沫太大了吧 只会拉excel 的人都自称数据科学家
DS这个行业确实没有存在的必要,engineer看两个小时的书就能搞定了。
早都降级到本科了 其实高中生也可以 靠嘴
精算也不行吗? 精算数学也很好的呀。
一句话总结下,没有good taste,干不了DS。。。
excel 挺好的。大牛么其实不care什么工具,手算,计算器,excel,各种high low level语言,或者直接雇个developer 拘泥于工具的,是developer或者SDE
别碰瓷。我们CS的高攀应数的不起。
大厂里很多applied scientist 就是ds
我老公他们公司ds组必须phd,有伯克利计算机博士,统计学博士,还有卡耐基的
速成ds的问题是,只会调包,不明白背后的统计/ml 原理,经常乱做,错了都不知道。
扯淡的
精算不用学统计?
每次外系导师都告诉我,去保险公司无脑做回归,一年10几万
meta这次是保ds而解雇了很多sde
可能是要搞元宇宙吧
确实是!之前我司一个data analyst乱用统计分析方法,被我给怼回去重做😂
看其他帖子,这次ds不是裁员的重灾区吗?
做回归是什么意思?
regression。甚至有些只用做linear的就够了
Re。绝大多数applied scientist基本就是data scientist换个名字
知耻而后勇
我面试 DS 主要问两大类问题,能够把 PCA 解释清楚的或者能够把 MCMC 解释清楚的,随便解释清楚一个地都可以考虑,两个都解释清楚的是 strong hire, 一个都没听说过或者解释不清的直接闲聊天,从来不问脑筋急转弯比如估算天上有多少飞机这种傻冒问题
生化环材,机械土木phd都可以做DS
还有很多硕士毕业也做DS
老印都彻底攻占DS了 根本就不懂统计 随便调个包就DS了
能把mcmc高清楚的肯定不多。能用bayes 公式推probability 就不错了,保证刷掉很多人。
Pca应该很多人懂。
比例。比例。
这种傻帽问题主要考raw talent ,你的问题考knowledge 不一样的工作要求
是的,真正的做ml基本上科班cs出身有顶会文章的,这种算ml食物链顶端吧
而且,对于公司而言,管你用啥模型,能够解决问题就行,调参数能够把模型调好、业绩上去,也就是本事
回归DS的工作性质,本身不是为了显摆machine learning水平有多高(你行你上啊,去deepmind,google research啊) 而是解析日常的business data,对business的理解,要远远比对ML的理解重要 公司业务好的时候是网红,不好的时候当然就没data可以分析了
我们公司ds, ml, 统计都不分,都要会
这几年一大堆没法转码的转DS啊, 本科生master大家都是数据科学家。
不过我们公司貌似一直都要求DS必须是phd。
一针见血,确实如此。
Phd也得看学什么的吧
精算转DS带不动?精算还是需要数学的
真的?其实我也觉得奇怪,上回和一个DS work,就是那种你要一定先把data给他format成什么样的格式我他才能用。我说算了 我自己来吧,不然他也给我解释不了output是啥意思。但是好的又domain expertise的DS应该很有用的。
太对了!所以data backed conclusion这件事也就听听就好了。
其实删掉红色部分,基本也差不离。。
“看到有个老黑在youtube上教excel也自称数据科学家,你说呢?”
其实这属于Da的领域,但是现在da,ds,ml都混在一起,鱼龙混杂
data格式的问题可以理解,工作忙起来真没时间一个一个去整理格式。同类data,标准格式会有效率很多。
精算转的那个估计没考过MAS1 和MAS2?前面有个层主说DS面试问PCA和MCMC,这两个东西是精算考试MAS2里面考试内容,而且这两块加起来占那门考试涵盖内容比重连15%都不到。
我们data格式都是统一的,是他自己的软件不能take,他不理解data也不知道怎么改
美国随便干啥都叫科学家。我看小朋友的定义挺好,不捣鼓试管的都不是科学家哈哈。
Data preprocessing 这种是ds的基本技能吧,连这块都不会吗。不管什么类型的数据,也可能是多数据源,都要会自己处理变换成自己想要的形式
apple店里的导购还叫genius呢,ds为啥不能叫科学家
额高人给解释解释PCA和MCMC吧
炫耀自己会写算法、鄙视别人调包的就是 关于为什么印度人做manager,中国人总做小黄人 的典型体现
这个有道理。做的好的需要有慧眼(根)。
记得去tesla site几个招人的刚毕业的小孩给我们说他们要招genius。瞬间把我吓坏了。我心想就我们这州立大学的水平,连faculty都算不上genius,工程学院的学生更是1/2+2/3不知道要通分的主,这难为我们了,咋改教学方案也不能产出genius呀。结果没几个月,学院里的本科硕士博士孩子们都高高兴兴去tesla上班了。
所以下一步ds要转sde了
本来就是垃圾学科,一点计算机一点统计就胡乱model
跟有些按摩师在油管上自称Dr xx同理。真的自己做好功课,不然上当的是自己
pca应该很多人可以的。mcmc不一定 mcmc里面挺多东西的
同求