问一下调参侠的职业发展

m
moonrain
楼主 (未名空间)

某大厂ML组scientist,主要做fraud detection
但又不是真的research team,平常工作主要是做feature,train model,deploy
model
然后汇报这个AUC/ROC提高了多少

但尴尬的是,真的涉及到production pipeline的东西,并不懂
因为我们只是user用API,有专门的SDE和engineering team负责技术上的东西
平常甚至连production code都不用写,jupyter notebook可以处理大部分工作了

peer presure很大,大家都是PhD,都挖空脑袋claim如果用了这个CNN那个GAN这个BERT神马的,会带来AUC多大的提高…… 自己又是半路出家的(虽然,绝大部分人也是抄书,真的有能力自己提出algorithm恐怕也会有更好出处)

这么下去是不是只能往PM转了?

c
chebyshev

只会写jupyter python的DS phd fresh。我叫他们业余时间写个算法预测spy之软件。
自己找
个数据源做好后端。然后放android手机上。手机app之icon按一下出来UP或者DOWN二字之一。然后用另一个程序算准确率。不靠近50%则找出错误。

不管再小的软件,哪怕是个notepad。先能自己写出来能用的release,
然后你会有别的想法。自己应能找到职业发展的答案。
没有代码能自理这个基础,考虑什么也没用。PM必然也做不好。

good luck。

【 在 moonrain (Just One Night) 的大作中提到: 】
: 某大厂ML组scientist,主要做fraud detection
: 但又不是真的research team,平常工作主要是做feature,train model,deploy
: model
: 然后汇报这个AUC/ROC提高了多少
: 但尴尬的是,真的涉及到production pipeline的东西,并不懂
: 因为我们只是user用API,有专门的SDE和engineering team负责技术上的东西
: 平常甚至连production code都不用写,jupyter notebook可以处理大部分工作了
: peer presure很大,大家都是PhD,都挖空脑袋claim如果用了这个CNN那个GAN这个
BERT
: 神马的,会带来AUC多大的提高…… 自己又是半路出家的(虽然,绝大部分人也是抄书
: ,真的有能力自己提出algorithm恐怕也会有更好出处)
: ...................

l
lightroom

recommendation和fraud detection两个应用会长久,招人还是挺看重经验的。如果自
己创新不够,就学习中国公司的做法。多开些会,networking, 看看别人怎么做的。

【 在 moonrain (Just One Night) 的大作中提到: 】
: 某大厂ML组scientist,主要做fraud detection
: 但又不是真的research team,平常工作主要是做feature,train model,deploy
: model
: 然后汇报这个AUC/ROC提高了多少
: 但尴尬的是,真的涉及到production pipeline的东西,并不懂
: 因为我们只是user用API,有专门的SDE和engineering team负责技术上的东西
: 平常甚至连production code都不用写,jupyter notebook可以处理大部分工作了
: peer presure很大,大家都是PhD,都挖空脑袋claim如果用了这个CNN那个GAN这个
BERT
: 神马的,会带来AUC多大的提高…… 自己又是半路出家的(虽然,绝大部分人也是抄书
: ,真的有能力自己提出algorithm恐怕也会有更好出处)
: ...................

f
fantasist

这已经是最好的职位了,去哪个公司都吃香喝辣

c
chebyshev

现在是jupyter notebook,过去是matlab...R,etc。
搞算法调参数的phd,确有不少代码不能自理,打字一个个按的。

如果不想办法,不然别说老印了,本版的helpme之流都会骑在头上。
越是phd越是被欺负。吃香喝辣的日子很难持续。

楼主能描述清楚软件人员与DS人员之掌控范围之不同,
必然已经发生过了不少龌龊。然后学会了。----这是学校学不到的。
【 在 fantasist (一) 的大作中提到: 】
: 这已经是最好的职位了,去哪个公司都吃香喝辣

c
chebyshev

这个竞争很剧烈吧?很难想象一队队phd,用jupyter notebook提高AUC的场景。

【 在 lightroom (吃一条鱼,思考一个问题,法号三丰) 的大作中提到: 】
: recommendation和fraud detection两个应用会长久,招人还是挺看重经验的。如果自
: 己创新不够,就学习中国公司的做法。多开些会,networking, 看看别人怎么做的。: BERT

r
repast

新东西都从用jupyter notebook/lab的phd那里来啊,说实话挺好用的。
整production code比较无趣,整production code的也很想玩下jypyter notebook上面的fancy 玩意的。

【 在 chebyshev (......) 的大作中提到: 】
: 只会写jupyter python的DS phd fresh。我叫他们业余时间写个算法预测spy之软件。
: 自己找
: 个数据源做好后端。然后放android手机上。手机app之icon按一下出来UP或者DOWN二字
: 之一。然后用另一个程序算准确率。不靠近50%则找出错误。
: 不管再小的软件,哪怕是个notepad。先能自己写出来能用的release,
: 然后你会有别的想法。自己应能找到职业发展的答案。
: 没有代码能自理这个基础,考虑什么也没用。PM必然也做不好。
: good luck。
: BERT

l
lightroom

google ads组优化CTR快20年了,每季度都有improvement. 以几何级数增长,现在是不是要比100%还多了?哈哈,还是不怎么高。你们想过为什么吗?所以有的搞。只是一方面。

另一方面,我给年轻ML managers的建议是,一定不要KPI就是增加准确率,半年一年就没什么意思,而且压力大,组里的气氛毒性变大。一定要不断寻找新的ML问题。所以主要是managers的问题。

【 在 chebyshev (......) 的大作中提到: 】
: 这个竞争很剧烈吧?很难想象一队队phd,用jupyter notebook提高AUC的场景。

f
fantasist


guvest啥话题都来胡扯一通,明显没见过大公司是怎么做ml的。从modeling到
productionize到ml infra,整个tech stack里搞jupyter是最爽的那类,因为想点idea就能生产impact,比起prod和infra烂活少多了。
楼主的问题在于peer pressure,觉得争credit拼不过其它吃苦耐劳的phd们,升级难。我猜大概率在f。去文化好点的大厂或者竞争没那么激烈的方向可以缓解;或者带着业
界顶尖的modeling知识,去小公司拉团队走m-track也不错。

【 在 repast (xebec) 的大作中提到: 】
: 新东西都从用jupyter notebook/lab的phd那里来啊,说实话挺好用的。
: 整production code比较无趣,整production code的也很想玩下jypyter notebook上面
: 的fancy 玩意的。

C
Caravel

there is always a choice。你们这里工资也高是吧。如果你只care研究的品味,可以换个真正像FAIR这样的部门。

【 在 moonrain (Just One Night) 的大作中提到: 】
: 某大厂ML组scientist,主要做fraud detection
: 但又不是真的research team,平常工作主要是做feature,train model,deploy
: model
: 然后汇报这个AUC/ROC提高了多少
: 但尴尬的是,真的涉及到production pipeline的东西,并不懂
: 因为我们只是user用API,有专门的SDE和engineering team负责技术上的东西
: 平常甚至连production code都不用写,jupyter notebook可以处理大部分工作了
: peer presure很大,大家都是PhD,都挖空脑袋claim如果用了这个CNN那个GAN这个
BERT
: 神马的,会带来AUC多大的提高…… 自己又是半路出家的(虽然,绝大部分人也是抄书
: ,真的有能力自己提出algorithm恐怕也会有更好出处)
: ...................

f
fantasist

g brain,fair这些不是想进就能进。不过楼主已经有一些ml background,有一点去打杂的机会

【 在 Caravel (克拉维尔) 的大作中提到: 】
: there is always a choice。你们这里工资也高是吧。如果你只care研究的品味,可以
: 换个真正像FAIR这样的部门。
: BERT

g
guvest

我上星期刚与三番一家大公司VP, fellow开会。可能要合作ML项目。各家有所不同。你認為我一無所知那就錯了。還沒ds這學科的時候我就在最大的公司做了十年算法。
我現管的也有ds phd。

你熟悉jupyter notebook么?如果我没记错,我是本版最早折腾这玩意的人之一。那要回到2015年了。找我当年literature programming 的笔记就知道问题出在哪了。技术
上也有原因,不可避免會反映出來。那時候哪有什麼大廠人用jupyter notebook。

你也可找個product line我看看其方向,我免費算一
卦。過兩年看結果。是不是胡扯,咱算個準確率。
【 在 fantasist(一) 的大作中提到: 】
<br>: guvest啥话题都来胡扯一通,明显没见过大公司是怎么做ml的。从
modeling到
<br>: productionize到ml infra,整个tech stack里搞jupyter是最爽的那类,因为想
点idea
<br>: 就能生产impact,比起prod和infra烂活少多了。
<br>: 楼主的问题在于peer pressure,觉得争credit拼不过其它吃苦耐劳的phd们,升
级难。
<br>: 我猜大概率在f。去文化好点的大厂或者竞争没那么激烈的方向可以缓解
;或者
带着业
<br>: 界顶尖的modeling知识,去小公司拉团队走m-track也不错。
<br>

g
guvest

可查下我之前的舊帖。折腾了好几年jupyter notebook。
旧帖也许仍有參
考價值。tool的問題,技術上的東西會帶到管理。

说实话要真想有主流AI/ML領域之新的idea,我觉得那還是得Cpp。工具會限制人的思維
。我做
工業項目,則要用C。

诸位不妨帮我挑挑错。看我当时的帖是否过时了,需要更新知识。

另外例如你是软件背景的人。接到了很好用的notebook。那notebook之作者多半对软件也是很了解的。不然你作为用户,不会被pleased。这跟能设计好api的人,要有软件积累类似。楼主缺的可能就是这方面的功夫。盯着AUC长远来看不是个办法。
【 在 repast(xebec) 的大作中提到: 】
<br>: 新东西都从用jupyter notebook/lab的phd那里来啊,说实话挺好用的。
<br>: 整production code比较无趣,整production code的也很想玩下jypyter notebook上面
<br>: 的fancy 玩意的。
<br>

g
guvest

不同用户数量级之下,比较同一个指标,这个統計可能會有misleading吧?
看上去是同一个问题,数据规模不同。那可能就是本质不同的问题了。

这几十年。用戶飛速增長。广告客户飞速增长。
goog能保持住20
年前的点击率已经相当厉害了。这方面地球上可能没其他公司能做到更好。

【 在 lightroom(吃一条鱼,思考一个问题,法号三丰) 的大作中提到: 】
<br>: google ads组优化CTR快20年了,每季度都有improvement. 以几何级数增长,现
在是不
<br>: 是要比100%还多了?哈哈,还是不怎么高。你们想过为什么吗?所以有的搞。只
是一方
<br>: 面。
<br>: 另一方面,我给年轻ML managers的建议是,一定不要KPI就是增加准确率,半年
一年就
<br>: 没什么意思,而且压力大,组里的气氛毒性变大。一定要不断寻找新的ML问题。
所以主
<br>: 要是managers的问题。
<br>

t
taylorlee

显然是做搜索推荐的,就是这个情况

【 在 chebyshev (......) 的大作中提到: 】
: 这个竞争很剧烈吧?很难想象一队队phd,用jupyter notebook提高AUC的场景。
:
: 【 在 lightroom (吃一条鱼,思考一个问题,法号三丰) 的大作中提到: 】
: : recommendation和fraud detection两个应用会长久,招人还是挺看重经验的。如
果自
: : 己创新不够,就学习中国公司的做法。多开些会,networking, 看看别人怎么做的。
: : BERT
n
netghost

如果你想比開會能力,你和他明顯還有差距,否則你不會還在羨慕什麼跑Jupyter
notebook的。

你屬於那種做云的時候是做收費的,做ML的時候是寫UI的,什麼大廠都呆過,hot的
area都做過,但是都是打雜的那種。問題是,廠很大,area hot和你有什麼關係嗎?

【 在 fantasist (一) 的大作中提到: 】
: guvest啥话题都来胡扯一通,明显没见过大公司是怎么做ml的。从modeling到
: productionize到ml infra,整个tech stack里搞jupyter是最爽的那类,因为想点
idea
: 就能生产impact,比起prod和infra烂活少多了。
: 楼主的问题在于peer pressure,觉得争credit拼不过其它吃苦耐劳的phd们,升级难。
: 我猜大概率在f。去文化好点的大厂或者竞争没那么激烈的方向可以缓解;或者带着业
: 界顶尖的modeling知识,去小公司拉团队走m-track也不错。

g
guvest


只从技术来考虑。我是2015年开始折腾notebook的。几年后去了软件公司,反而新的发展没有时间follow。听听新的观点也不错。
旧雨新知,都有好处。

【 在 netghost(Up to Isomorphism) 的大作中提到: 】

: 如果你想比開會能力,你和他明顯還有差距,否則你不會還在羨慕什麼跑
Jupyter

: notebook的。

: 你屬於那種做云的時候是做收費的,做ML的時候是寫UI的,什麼大廠都呆過,
hot的

: area都做過,但是都是打雜的那種。問題是,廠很大,area hot和你有什麼關係嗎?

: idea

n
netghost

不管你做什麼方向的,只要你能抓住第一性的東西還能有點實際產出,不可能日子難過。

【 在 guvest (我爱你老婆Anna) 的大作中提到: 】
: 只从技术来考虑。我是2015年开始折腾notebook的。几年后去了软件公司,反而新的发
: 展没有时间follow。听听新的观点也不错。
: 旧雨新知,都有好处。
:
: 如果你想比開會能力,你和他明顯還有差距,否則你不會還在羨慕什麼跑
: Jupyter
:
: notebook的。
:
: 你屬於那種做云的時候是做收費的,做ML的時候是寫UI的,什麼大廠都呆過,: hot的
:
: area都做過,但是都是打雜的那種。問題是,廠很大,area hot和你有什麼關係
: 嗎?
: ...................

f
fantasist

你做了啥,有资格看不起收费的?aws usage metering team 10年前就要处理海量的数据。

论扯淡能力,guvest在版上说第二,估计没人会说自己第一。但把才能用来整天灌水也是白瞎了。
【 在 netghost (Up to Isomorphism) 的大作中提到: 】
: 如果你想比開會能力,你和他明顯還有差距,否則你不會還在羨慕什麼跑Jupyter
: notebook的。
: 你屬於那種做云的時候是做收費的,做ML的時候是寫UI的,什麼大廠都呆過,hot的
: area都做過,但是都是打雜的那種。問題是,廠很大,area hot和你有什麼關係嗎?: idea

n
netghost

我可沒看不起收費的,問題是第一你不是收費的,你是做收費工具的,做收費工具其實我也沒看不起。第二是你既然是做週邊的你就不能用core的姿態來說別人懂還不懂,尤其是說怎麼在公司最好混的種事情。

【 在 fantasist (一) 的大作中提到: 】
: 你做了啥,有资格看不起收费的?aws usage metering team 10年前就要处理海量的数
: 据。
: 论扯淡能力,guvest在版上说第二,估计没人会说自己第一。但把才能用来整天灌水也
: 是白瞎了。

f
fantasist

这就是你们不懂大公司的地方。一是既然已经变成大公司,核心产品基本固定,从零到一的机会很少,挑新产品做失败的风险极高。楼主看起来是比较新的人,只有两条路,要不带着domain knowledge去小地方赌,要不就去日子好过的地方混,内卷已经起来的地方再努力也没出路。二是所有的pillar都细分成很多组,不管是底下打杂的还是
上边画饼的,谁离开都可能随时补上。像你可能觉得自己有两把刷子,小公司离了你就混不下去,这种事在大公司是不会发生的,牛逼轰轰没意义,平时还是别有自己扛起了一个domain这种幻想比较好。
【 在 netghost (Up to Isomorphism) 的大作中提到: 】
: 我可沒看不起收費的,問題是第一你不是收費的,你是做收費工具的,做收費工具其實
: 我也沒看不起。第二是你既然是做週邊的你就不能用core的姿態來說別人懂還不懂,尤
: 其是說怎麼在公司最好混的種事情。

g
guvest

我以前所在的大公司离了我就在一个领域混不下去了。这是我的看法。是否正确,尚待时间来验证。
我走之后三年换了三任Product line manager。design, FW, software tool, app
manager不知换了多
少。半年一次re org。

前不久换senior VP。有人找我。我说我们都在认识真理的路上。

没有炫耀的意思.你当故事看笑笑就好。
我的意思是:即便在大公司当螺丝钉,(尤其是年轻人)也没有理由限制自己的想象力
。十年时间走到领域第一排完全doable 。
为何你不行?
你不行别人就不行?
这些俗见毫无意义。实际上这些俗见才是未验证的illusion。
稍加思考就知道不可靠。
【 在 fantasist(一) 的大作中提到: 】
<br>: 这就是你们不懂大公司的地方。一是既然已经变成大公司,核心产品基本固定,
从零到
<br>: 一的机会很少,挑新产品做失败的风险极高。楼主看起来是比较新的人,只有两
条路,
<br>: 要不带着domain knowledge去小地方赌,要不就去日子好过的地方混,内卷已经
起来的
<br>: 地方再努力也没出路。二是所有的pillar都细分成很多组,不管是底下打杂的还是
<br>: 上边画饼的,谁离开都可能随时补上。像你可能觉得自己有两把刷子,小公司离
了你就
<br>: 混不下去,这种事在大公司是不会发生的,牛逼轰轰没意义,平时还是别有自己
扛起了
<br>: 一个domain这种幻想比较好。
<br>

g
guvest

我刚看了下。好像周五INTC 股票居然跌了5%。
不知道是不是把TLB焊死的缘故。
还是因为我这两星期吐槽造成的。

【 在 fantasist(一) 的大作中提到: 】
<br>: 你做了啥,有资格看不起收费的?aws usage metering team 10年前就要处理海
量的数
<br>: 据。
<br>: 论扯淡能力,guvest在版上说第二,估计没人会说自己第一。但把才能用来整天
灌水也
<br>: 是白瞎了。
<br>

w
waynezh

同在某大厂做ml方面的。我觉得不钻算法(或者没这个能力的)的ds或者ml scientist还是不要花太多时间在提高什么auc或者pr上面, 你可以多熟悉熟悉你这个领域的
business logic,找到一些全新的问题。前者无非就是增高1%,或者2%, who
cares。 后者好歹是从0到1,影响大多了。
T
Thorondor

听起来楼主似乎是亚麻某org的。调参和特征工程确实比较枯燥,争取数据上量吧,上
大数据平台跑起来。