抛砖引玉,说一说现在DS行业各种职位的要求和区别

兔兔_猪猪
楼主 (北美华人网)
之前跳槽来闲话版求了bless,顺利拿到了offer。今天有空,就来聊一聊现在的DS行业各种职位的要求和区别吧。经常看到有人问要不要转DS或者干脆转码,希望这个帖子能给大家一些参考,也算是对版上的回馈。
先声明一下,lz是理工科转的DS,非科班出身,入行也才4、5年,在这里只是说一说我自己的看法,不一定全面,就当是抛砖引玉。如果大家有别的观点,欢迎一起讨论。
我觉得title叫Data scientist及其相关的职位大致可以分成以下四类(因为各个公司给的title都不一样,下面主要是根据job responsibilities分的)。 Data analyst. 很多大公司虽然叫data scientist,做的事情却是analytics方面的,主要是分析数据中的隐藏的信息,跟product方面的人合作,指导产品的方向。这个方向最重要的是要有business sense,能敏感地从数据中发现对product有用的地方。Presentation的技能也很重要,知道怎样讲故事,能将自己的发现推销出去,从而影响product的未来走向。技术上一般需要熟练掌握SQL和experiment design(比如A/B test),对编程语言的要求不是很高,也不会用到machine learning 。 General data scientist. 职责范围很大,不同公司可能不一样。简单的说,是运用data解决product的实际需求,比如forecast,recommendation等等。一般主要是做prototype,需要一定的编程能力和对ML各种经典方法的理解。现在有很多ML package可以用,所以不一定需要自己implement算法,有时候会被戏称为”调包侠”。但我觉得并不只是”调包”这么简单,很多时候数据来源的选择和数据预处理也很重要,忽略初始数据的重要性很可能是garbage in garbage out 的结果。如果要跟进最新的算法的话,也需要根据论文自己implement算法。总而言之,这一类职位的要求变化很多,甚至同一个公司不同的组也不一样,不能一概而论。 Research scientist. 偏academia,一般要求科班出身的PhD,相关领域发表过文章。职责主要是研究新的算法,发表文章,推进技术发展。转行的话除了个别公司基本就不用考虑这一类了。 Machine learning engineer. 就是懂ML的software engineer,对编程要求高,还需要理解并会implement ML的算法,从某种程度上是2的加强版。我觉得其实两者没有明确界限,有的公司的DS也写production code,有的公司的MLE也做prototyping,所以2和4转换是完全可行的,但面试准备的侧重点不一样。2很多要做take home然后present,可以不刷或者只刷一些简单题。MLE肯定要刷题,一般还要考system design。两者都会考ML。
跟前几年比,我觉得现在的DS行业的面试更有条理,不再是考的五花八门,让人不知从何处开始准备了。随着DS专业毕业的人越来越多,入行的bar也提升了。但这并不意味着对其他领域的人关上大门,关键还是要根据自己的实际情况找到适合自己的那条路,然后积极地走下去。希望这个帖子能给还在迷茫中的人一点帮助,也欢迎版上的大牛们一起分享讨论!
最后再求个bless,希望自己H1B transfer能一切顺利!🙏
w
wfmlover
纠正一下,转行的理工科PhD,大都在research/applied scientist
s
seven11
谢谢科普
兔兔_猪猪
谢谢纠正,可以展开说一说吗? 我自己的感觉是前几年理工科PhD转行进research/applied scientist的确很多,现在bar高了就少了。当然也看公司,可能我的sample size不够。
T
Tsubasa
lz转行进DS已经很不错了。AS和MLE在不少地方都比SWE的收入还要高,MLE就不说了,RS和AS都是要专业对口的极少存在转行一说,进大厂主要还是因为专业方向被大厂投资了
b
bellshirt
其实当美国总统也是不错的工作。据说平均工资20万美元,就是openings太少。
w
wfmlover
回复 4楼兔兔_猪猪的帖子
DS是给Master的,至少几个大tech是这样 所以只要是PhD,很多都面试RS/AS了 或者说,每个有PhD学位的DS,都处在转RS/AS的努力中

风吹过羊秃了
楼主我比较有兴趣您是从哪个行业转过来的,如何转的,可以展开说说吗,谢谢
兔兔_猪猪
回复 4楼兔兔_猪猪的帖子
DS是给Master的,至少几个大tech是这样 所以只要是PhD,很多都面试RS/AS了 或者说,每个有PhD学位的DS,都处在转RS/AS的努力中


wfmlover 发表于 2021-08-30 02:23

这个也就amazon吧,其他大厂比如Google,没有相关专业PhD很难直接到RS的。当然还有公司比如fb的大部分RS其实是eng track,相当于MLE。
兔兔_猪猪
楼主我比较有兴趣您是从哪个行业转过来的,如何转的,可以展开说说吗,谢谢
风吹过羊秃了 发表于 2021-08-30 03:44

lz很久以前写过一个帖子,这里就不重复了,感兴趣的话可以搜到。
H
Hawaiitime
谢谢楼主分享 bless楼主h1b transfer成功
兔兔_猪猪
其实当美国总统也是不错的工作。据说平均工资20万美元,就是openings太少。
bellshirt 发表于 2021-08-30 02:03

哈哈。相比之下DS还是有很多opening😂
兔兔_猪猪
回复 11楼Hawaiitime的帖子
谢谢🙏
w
williamzwly
Mark 一下再看
m
moonbag
谢谢分享!
大菠萝小菠萝
这个也就amazon吧,其他大厂比如Google,没有相关专业PhD很难直接到RS的。当然还有公司比如fb的大部分RS其实是eng track,相当于MLE。

兔兔_猪猪 发表于 2021-08-30 17:10

亚麻的rs和别的公司的rs不一样,amazon的ds,rs不如as要求高,但as也很多本科生,master就能面。

千渔千寻
回复 2楼wfmlover的帖子
我建议能转SDE转SDE,一亩三分地里面已经有升到狗7的DS/MLE,打算想要转回SDE。

灌水不要认真
Ds 性价比极低 门槛很高面试很乱 嘎乐呵多年了的都想转SWE
w
wfmlover
Ds 性价比极低 门槛很高面试很乱 嘎乐呵多年了的都想转SWE
灌水不要认真 发表于 2021-08-30 18:43

对啊对啊,面试想挂人太容易了 各种非cs的stat/or/phys等等,做不了medium题目 cs master过来的,一考bayes rule就必然挂

p
provencebebe
谢谢楼主分享和详细介绍, 祝福你成功
灌水不要认真
然而考这些有什么意义?我不懂 我觉得fb的ds标准就挺好 能用数据解决产品问题 就行了 你还想怎么样?设计一个卫星上天吗?
u
uswhy
然而考这些有什么意义?我不懂 我觉得fb的ds标准就挺好 能用数据解决产品问题 就行了 你还想怎么样?设计一个卫星上天吗?
灌水不要认真 发表于 2021-08-30 19:45

刷人用啊 刷下去绝大部分 面试造火箭 上班拧螺丝
l
lcbaby
blessing.
灌水不要认真
刷人用啊 刷下去绝大部分 面试造火箭 上班拧螺丝
uswhy 发表于 2021-08-30 20:08

噗嗤
m
mswallgrass
之前跳槽来闲话版求了bless,顺利拿到了offer。今天有空,就来聊一聊现在的DS行业各种职位的要求和区别吧。经常看到有人问要不要转DS或者干脆转码,希望这个帖子能给大家一些参考,也算是对版上的回馈。
先声明一下,lz是理工科转的DS,非科班出身,入行也才4、5年,在这里只是说一说我自己的看法,不一定全面,就当是抛砖引玉。如果大家有别的观点,欢迎一起讨论。
我觉得title叫Data scientist及其相关的职位大致可以分成以下四类(因为各个公司给的title都不一样,下面主要是根据job responsibilities分的)。 Data analyst. 很多大公司虽然叫data scientist,做的事情却是analytics方面的,主要是分析数据中的隐藏的信息,跟product方面的人合作,指导产品的方向。这个方向最重要的是要有business sense,能敏感地从数据中发现对product有用的地方。Presentation的技能也很重要,知道怎样讲故事,能将自己的发现推销出去,从而影响product的未来走向。技术上一般需要熟练掌握SQL和experiment design(比如A/B test),对编程语言的要求不是很高,也不会用到machine learning 。 General data scientist. 职责范围很大,不同公司可能不一样。简单的说,是运用data解决product的实际需求,比如forecast,recommendation等等。一般主要是做prototype,需要一定的编程能力和对ML各种经典方法的理解。现在有很多ML package可以用,所以不一定需要自己implement算法,有时候会被戏称为”调包侠”。但我觉得并不只是”调包”这么简单,很多时候数据来源的选择和数据预处理也很重要,忽略初始数据的重要性很可能是garbage in garbage out 的结果。如果要跟进最新的算法的话,也需要根据论文自己implement算法。总而言之,这一类职位的要求变化很多,甚至同一个公司不同的组也不一样,不能一概而论。 Research scientist. 偏academia,一般要求科班出身的PhD,相关领域发表过文章。职责主要是研究新的算法,发表文章,推进技术发展。转行的话除了个别公司基本就不用考虑这一类了。 Machine learning engineer. 就是懂ML的software engineer,对编程要求高,还需要理解并会implement ML的算法,从某种程度上是2的加强版。我觉得其实两者没有明确界限,有的公司的DS也写production code,有的公司的MLE也做prototyping,所以2和4转换是完全可行的,但面试准备的侧重点不一样。2很多要做take home然后present,可以不刷或者只刷一些简单题。MLE肯定要刷题,一般还要考system design。两者都会考ML。
跟前几年比,我觉得现在的DS行业的面试更有条理,不再是考的五花八门,让人不知从何处开始准备了。随着DS专业毕业的人越来越多,入行的bar也提升了。但这并不意味着对其他领域的人关上大门,关键还是要根据自己的实际情况找到适合自己的那条路,然后积极地走下去。希望这个帖子能给还在迷茫中的人一点帮助,也欢迎版上的大牛们一起分享讨论!
最后再求个bless,希望自己H1B transfer能一切顺利!🙏
兔兔_猪猪 发表于 2021-08-30 00:53

mark 谢谢lz分享
s
start_from_here
rs每个公司叫法都不一样,在脸书🐶主要是做research发顶会,在亚麻微软就是不到coding bar的as(很多做OR的来大厂都做了rs),所以还得看具体做啥。 其实早先fb的ds性价比很高的,package给的跟sde差不多,最近几年给的不如sde了。