看帖神器
未名空间
追帖动态
头条新闻
每日新帖
最新热帖
新闻存档
热帖存档
文学城
虎扑论坛
未名空间
北美华人网
北美微论坛
看帖神器
登录
← 下载
《看帖神器》官方
iOS App
,体验轻松追帖。
问一下调参侠的职业发展
查看未名空间今日新帖
最新回复:2021年7月24日 22点7分 PT
共 (25) 楼
返回列表
订阅追帖
只看未读
更多选项
阅读全帖
只看图片
只看视频
查看原帖
m
moonrain
大约 3 年
楼主 (未名空间)
某大厂ML组scientist,主要做fraud detection
但又不是真的research team,平常工作主要是做feature,train model,deploy
model
然后汇报这个AUC/ROC提高了多少
但尴尬的是,真的涉及到production pipeline的东西,并不懂
因为我们只是user用API,有专门的SDE和engineering team负责技术上的东西
平常甚至连production code都不用写,jupyter notebook可以处理大部分工作了
peer presure很大,大家都是PhD,都挖空脑袋claim如果用了这个CNN那个GAN这个BERT神马的,会带来AUC多大的提高…… 自己又是半路出家的(虽然,绝大部分人也是抄书,真的有能力自己提出algorithm恐怕也会有更好出处)
这么下去是不是只能往PM转了?
c
chebyshev
大约 3 年
2 楼
只会写jupyter python的DS phd fresh。我叫他们业余时间写个算法预测spy之软件。
自己找
个数据源做好后端。然后放android手机上。手机app之icon按一下出来UP或者DOWN二字之一。然后用另一个程序算准确率。不靠近50%则找出错误。
不管再小的软件,哪怕是个notepad。先能自己写出来能用的release,
然后你会有别的想法。自己应能找到职业发展的答案。
没有代码能自理这个基础,考虑什么也没用。PM必然也做不好。
good luck。
【 在 moonrain (Just One Night) 的大作中提到: 】
: 某大厂ML组scientist,主要做fraud detection
: 但又不是真的research team,平常工作主要是做feature,train model,deploy
: model
: 然后汇报这个AUC/ROC提高了多少
: 但尴尬的是,真的涉及到production pipeline的东西,并不懂
: 因为我们只是user用API,有专门的SDE和engineering team负责技术上的东西
: 平常甚至连production code都不用写,jupyter notebook可以处理大部分工作了
: peer presure很大,大家都是PhD,都挖空脑袋claim如果用了这个CNN那个GAN这个
BERT
: 神马的,会带来AUC多大的提高…… 自己又是半路出家的(虽然,绝大部分人也是抄书
: ,真的有能力自己提出algorithm恐怕也会有更好出处)
: ...................
l
lightroom
大约 3 年
3 楼
recommendation和fraud detection两个应用会长久,招人还是挺看重经验的。如果自
己创新不够,就学习中国公司的做法。多开些会,networking, 看看别人怎么做的。
【 在 moonrain (Just One Night) 的大作中提到: 】
: 某大厂ML组scientist,主要做fraud detection
: 但又不是真的research team,平常工作主要是做feature,train model,deploy
: model
: 然后汇报这个AUC/ROC提高了多少
: 但尴尬的是,真的涉及到production pipeline的东西,并不懂
: 因为我们只是user用API,有专门的SDE和engineering team负责技术上的东西
: 平常甚至连production code都不用写,jupyter notebook可以处理大部分工作了
: peer presure很大,大家都是PhD,都挖空脑袋claim如果用了这个CNN那个GAN这个
BERT
: 神马的,会带来AUC多大的提高…… 自己又是半路出家的(虽然,绝大部分人也是抄书
: ,真的有能力自己提出algorithm恐怕也会有更好出处)
: ...................
f
fantasist
大约 3 年
4 楼
这已经是最好的职位了,去哪个公司都吃香喝辣
c
chebyshev
大约 3 年
5 楼
现在是jupyter notebook,过去是matlab...R,etc。
搞算法调参数的phd,确有不少代码不能自理,打字一个个按的。
如果不想办法,不然别说老印了,本版的helpme之流都会骑在头上。
越是phd越是被欺负。吃香喝辣的日子很难持续。
楼主能描述清楚软件人员与DS人员之掌控范围之不同,
必然已经发生过了不少龌龊。然后学会了。----这是学校学不到的。
【 在 fantasist (一) 的大作中提到: 】
: 这已经是最好的职位了,去哪个公司都吃香喝辣
c
chebyshev
大约 3 年
6 楼
这个竞争很剧烈吧?很难想象一队队phd,用jupyter notebook提高AUC的场景。
【 在 lightroom (吃一条鱼,思考一个问题,法号三丰) 的大作中提到: 】
: recommendation和fraud detection两个应用会长久,招人还是挺看重经验的。如果自
: 己创新不够,就学习中国公司的做法。多开些会,networking, 看看别人怎么做的。: BERT
r
repast
大约 3 年
7 楼
新东西都从用jupyter notebook/lab的phd那里来啊,说实话挺好用的。
整production code比较无趣,整production code的也很想玩下jypyter notebook上面的fancy 玩意的。
【 在 chebyshev (......) 的大作中提到: 】
: 只会写jupyter python的DS phd fresh。我叫他们业余时间写个算法预测spy之软件。
: 自己找
: 个数据源做好后端。然后放android手机上。手机app之icon按一下出来UP或者DOWN二字
: 之一。然后用另一个程序算准确率。不靠近50%则找出错误。
: 不管再小的软件,哪怕是个notepad。先能自己写出来能用的release,
: 然后你会有别的想法。自己应能找到职业发展的答案。
: 没有代码能自理这个基础,考虑什么也没用。PM必然也做不好。
: good luck。
: BERT
l
lightroom
大约 3 年
8 楼
google ads组优化CTR快20年了,每季度都有improvement. 以几何级数增长,现在是不是要比100%还多了?哈哈,还是不怎么高。你们想过为什么吗?所以有的搞。只是一方面。
另一方面,我给年轻ML managers的建议是,一定不要KPI就是增加准确率,半年一年就没什么意思,而且压力大,组里的气氛毒性变大。一定要不断寻找新的ML问题。所以主要是managers的问题。
【 在 chebyshev (......) 的大作中提到: 】
: 这个竞争很剧烈吧?很难想象一队队phd,用jupyter notebook提高AUC的场景。
f
fantasist
大约 3 年
9 楼
guvest啥话题都来胡扯一通,明显没见过大公司是怎么做ml的。从modeling到
productionize到ml infra,整个tech stack里搞jupyter是最爽的那类,因为想点idea就能生产impact,比起prod和infra烂活少多了。
楼主的问题在于peer pressure,觉得争credit拼不过其它吃苦耐劳的phd们,升级难。我猜大概率在f。去文化好点的大厂或者竞争没那么激烈的方向可以缓解;或者带着业
界顶尖的modeling知识,去小公司拉团队走m-track也不错。
【 在 repast (xebec) 的大作中提到: 】
: 新东西都从用jupyter notebook/lab的phd那里来啊,说实话挺好用的。
: 整production code比较无趣,整production code的也很想玩下jypyter notebook上面
: 的fancy 玩意的。
C
Caravel
大约 3 年
10 楼
there is always a choice。你们这里工资也高是吧。如果你只care研究的品味,可以换个真正像FAIR这样的部门。
【 在 moonrain (Just One Night) 的大作中提到: 】
: 某大厂ML组scientist,主要做fraud detection
: 但又不是真的research team,平常工作主要是做feature,train model,deploy
: model
: 然后汇报这个AUC/ROC提高了多少
: 但尴尬的是,真的涉及到production pipeline的东西,并不懂
: 因为我们只是user用API,有专门的SDE和engineering team负责技术上的东西
: 平常甚至连production code都不用写,jupyter notebook可以处理大部分工作了
: peer presure很大,大家都是PhD,都挖空脑袋claim如果用了这个CNN那个GAN这个
BERT
: 神马的,会带来AUC多大的提高…… 自己又是半路出家的(虽然,绝大部分人也是抄书
: ,真的有能力自己提出algorithm恐怕也会有更好出处)
: ...................
f
fantasist
大约 3 年
11 楼
g brain,fair这些不是想进就能进。不过楼主已经有一些ml background,有一点去打杂的机会
【 在 Caravel (克拉维尔) 的大作中提到: 】
: there is always a choice。你们这里工资也高是吧。如果你只care研究的品味,可以
: 换个真正像FAIR这样的部门。
: BERT
g
guvest
大约 3 年
12 楼
我上星期刚与三番一家大公司VP, fellow开会。可能要合作ML项目。各家有所不同。你認為我一無所知那就錯了。還沒ds這學科的時候我就在最大的公司做了十年算法。
我現管的也有ds phd。
你熟悉jupyter notebook么?如果我没记错,我是本版最早折腾这玩意的人之一。那要回到2015年了。找我当年literature programming 的笔记就知道问题出在哪了。技术
上也有原因,不可避免會反映出來。那時候哪有什麼大廠人用jupyter notebook。
你也可找個product line我看看其方向,我免費算一
卦。過兩年看結果。是不是胡扯,咱算個準確率。
【 在 fantasist(一) 的大作中提到: 】
<br>: guvest啥话题都来胡扯一通,明显没见过大公司是怎么做ml的。从
modeling到
<br>: productionize到ml infra,整个tech stack里搞jupyter是最爽的那类,因为想
点idea
<br>: 就能生产impact,比起prod和infra烂活少多了。
<br>: 楼主的问题在于peer pressure,觉得争credit拼不过其它吃苦耐劳的phd们,升
级难。
<br>: 我猜大概率在f。去文化好点的大厂或者竞争没那么激烈的方向可以缓解
;或者
带着业
<br>: 界顶尖的modeling知识,去小公司拉团队走m-track也不错。
<br>
g
guvest
大约 3 年
13 楼
可查下我之前的舊帖。折腾了好几年jupyter notebook。
旧帖也许仍有參
考價值。tool的問題,技術上的東西會帶到管理。
说实话要真想有主流AI/ML領域之新的idea,我觉得那還是得Cpp。工具會限制人的思維
。我做
工業項目,則要用C。
诸位不妨帮我挑挑错。看我当时的帖是否过时了,需要更新知识。
另外例如你是软件背景的人。接到了很好用的notebook。那notebook之作者多半对软件也是很了解的。不然你作为用户,不会被pleased。这跟能设计好api的人,要有软件积累类似。楼主缺的可能就是这方面的功夫。盯着AUC长远来看不是个办法。
【 在 repast(xebec) 的大作中提到: 】
<br>: 新东西都从用jupyter notebook/lab的phd那里来啊,说实话挺好用的。
<br>: 整production code比较无趣,整production code的也很想玩下jypyter notebook上面
<br>: 的fancy 玩意的。
<br>
g
guvest
大约 3 年
14 楼
不同用户数量级之下,比较同一个指标,这个統計可能會有misleading吧?
看上去是同一个问题,数据规模不同。那可能就是本质不同的问题了。
这几十年。用戶飛速增長。广告客户飞速增长。
goog能保持住20
年前的点击率已经相当厉害了。这方面地球上可能没其他公司能做到更好。
【 在 lightroom(吃一条鱼,思考一个问题,法号三丰) 的大作中提到: 】
<br>: google ads组优化CTR快20年了,每季度都有improvement. 以几何级数增长,现
在是不
<br>: 是要比100%还多了?哈哈,还是不怎么高。你们想过为什么吗?所以有的搞。只
是一方
<br>: 面。
<br>: 另一方面,我给年轻ML managers的建议是,一定不要KPI就是增加准确率,半年
一年就
<br>: 没什么意思,而且压力大,组里的气氛毒性变大。一定要不断寻找新的ML问题。
所以主
<br>: 要是managers的问题。
<br>
t
taylorlee
大约 3 年
15 楼
显然是做搜索推荐的,就是这个情况
【 在 chebyshev (......) 的大作中提到: 】
: 这个竞争很剧烈吧?很难想象一队队phd,用jupyter notebook提高AUC的场景。
:
: 【 在 lightroom (吃一条鱼,思考一个问题,法号三丰) 的大作中提到: 】
: : recommendation和fraud detection两个应用会长久,招人还是挺看重经验的。如
果自
: : 己创新不够,就学习中国公司的做法。多开些会,networking, 看看别人怎么做的。
: : BERT
n
netghost
大约 3 年
16 楼
如果你想比開會能力,你和他明顯還有差距,否則你不會還在羨慕什麼跑Jupyter
notebook的。
你屬於那種做云的時候是做收費的,做ML的時候是寫UI的,什麼大廠都呆過,hot的
area都做過,但是都是打雜的那種。問題是,廠很大,area hot和你有什麼關係嗎?
【 在 fantasist (一) 的大作中提到: 】
: guvest啥话题都来胡扯一通,明显没见过大公司是怎么做ml的。从modeling到
: productionize到ml infra,整个tech stack里搞jupyter是最爽的那类,因为想点
idea
: 就能生产impact,比起prod和infra烂活少多了。
: 楼主的问题在于peer pressure,觉得争credit拼不过其它吃苦耐劳的phd们,升级难。
: 我猜大概率在f。去文化好点的大厂或者竞争没那么激烈的方向可以缓解;或者带着业
: 界顶尖的modeling知识,去小公司拉团队走m-track也不错。
g
guvest
大约 3 年
17 楼
只从技术来考虑。我是2015年开始折腾notebook的。几年后去了软件公司,反而新的发展没有时间follow。听听新的观点也不错。
旧雨新知,都有好处。
【 在 netghost(Up to Isomorphism) 的大作中提到: 】
: 如果你想比開會能力,你和他明顯還有差距,否則你不會還在羨慕什麼跑
Jupyter
: notebook的。
: 你屬於那種做云的時候是做收費的,做ML的時候是寫UI的,什麼大廠都呆過,
hot的
: area都做過,但是都是打雜的那種。問題是,廠很大,area hot和你有什麼關係嗎?
: idea
n
netghost
大约 3 年
18 楼
不管你做什麼方向的,只要你能抓住第一性的東西還能有點實際產出,不可能日子難過。
【 在 guvest (我爱你老婆Anna) 的大作中提到: 】
: 只从技术来考虑。我是2015年开始折腾notebook的。几年后去了软件公司,反而新的发
: 展没有时间follow。听听新的观点也不错。
: 旧雨新知,都有好处。
:
: 如果你想比開會能力,你和他明顯還有差距,否則你不會還在羨慕什麼跑
: Jupyter
:
: notebook的。
:
: 你屬於那種做云的時候是做收費的,做ML的時候是寫UI的,什麼大廠都呆過,: hot的
:
: area都做過,但是都是打雜的那種。問題是,廠很大,area hot和你有什麼關係
: 嗎?
: ...................
f
fantasist
大约 3 年
19 楼
你做了啥,有资格看不起收费的?aws usage metering team 10年前就要处理海量的数据。
论扯淡能力,guvest在版上说第二,估计没人会说自己第一。但把才能用来整天灌水也是白瞎了。
【 在 netghost (Up to Isomorphism) 的大作中提到: 】
: 如果你想比開會能力,你和他明顯還有差距,否則你不會還在羨慕什麼跑Jupyter
: notebook的。
: 你屬於那種做云的時候是做收費的,做ML的時候是寫UI的,什麼大廠都呆過,hot的
: area都做過,但是都是打雜的那種。問題是,廠很大,area hot和你有什麼關係嗎?: idea
n
netghost
大约 3 年
20 楼
我可沒看不起收費的,問題是第一你不是收費的,你是做收費工具的,做收費工具其實我也沒看不起。第二是你既然是做週邊的你就不能用core的姿態來說別人懂還不懂,尤其是說怎麼在公司最好混的種事情。
【 在 fantasist (一) 的大作中提到: 】
: 你做了啥,有资格看不起收费的?aws usage metering team 10年前就要处理海量的数
: 据。
: 论扯淡能力,guvest在版上说第二,估计没人会说自己第一。但把才能用来整天灌水也
: 是白瞎了。
f
fantasist
大约 3 年
21 楼
这就是你们不懂大公司的地方。一是既然已经变成大公司,核心产品基本固定,从零到一的机会很少,挑新产品做失败的风险极高。楼主看起来是比较新的人,只有两条路,要不带着domain knowledge去小地方赌,要不就去日子好过的地方混,内卷已经起来的地方再努力也没出路。二是所有的pillar都细分成很多组,不管是底下打杂的还是
上边画饼的,谁离开都可能随时补上。像你可能觉得自己有两把刷子,小公司离了你就混不下去,这种事在大公司是不会发生的,牛逼轰轰没意义,平时还是别有自己扛起了一个domain这种幻想比较好。
【 在 netghost (Up to Isomorphism) 的大作中提到: 】
: 我可沒看不起收費的,問題是第一你不是收費的,你是做收費工具的,做收費工具其實
: 我也沒看不起。第二是你既然是做週邊的你就不能用core的姿態來說別人懂還不懂,尤
: 其是說怎麼在公司最好混的種事情。
g
guvest
大约 3 年
22 楼
我以前所在的大公司离了我就在一个领域混不下去了。这是我的看法。是否正确,尚待时间来验证。
我走之后三年换了三任Product line manager。design, FW, software tool, app
manager不知换了多
少。半年一次re org。
前不久换senior VP。有人找我。我说我们都在认识真理的路上。
没有炫耀的意思.你当故事看笑笑就好。
我的意思是:即便在大公司当螺丝钉,(尤其是年轻人)也没有理由限制自己的想象力
。十年时间走到领域第一排完全doable 。
为何你不行?
你不行别人就不行?
这些俗见毫无意义。实际上这些俗见才是未验证的illusion。
稍加思考就知道不可靠。
【 在 fantasist(一) 的大作中提到: 】
<br>: 这就是你们不懂大公司的地方。一是既然已经变成大公司,核心产品基本固定,
从零到
<br>: 一的机会很少,挑新产品做失败的风险极高。楼主看起来是比较新的人,只有两
条路,
<br>: 要不带着domain knowledge去小地方赌,要不就去日子好过的地方混,内卷已经
起来的
<br>: 地方再努力也没出路。二是所有的pillar都细分成很多组,不管是底下打杂的还是
<br>: 上边画饼的,谁离开都可能随时补上。像你可能觉得自己有两把刷子,小公司离
了你就
<br>: 混不下去,这种事在大公司是不会发生的,牛逼轰轰没意义,平时还是别有自己
扛起了
<br>: 一个domain这种幻想比较好。
<br>
g
guvest
大约 3 年
23 楼
我刚看了下。好像周五INTC 股票居然跌了5%。
不知道是不是把TLB焊死的缘故。
还是因为我这两星期吐槽造成的。
【 在 fantasist(一) 的大作中提到: 】
<br>: 你做了啥,有资格看不起收费的?aws usage metering team 10年前就要处理海
量的数
<br>: 据。
<br>: 论扯淡能力,guvest在版上说第二,估计没人会说自己第一。但把才能用来整天
灌水也
<br>: 是白瞎了。
<br>
w
waynezh
大约 3 年
24 楼
同在某大厂做ml方面的。我觉得不钻算法(或者没这个能力的)的ds或者ml scientist还是不要花太多时间在提高什么auc或者pr上面, 你可以多熟悉熟悉你这个领域的
business logic,找到一些全新的问题。前者无非就是增高1%,或者2%, who
cares。 后者好歹是从0到1,影响大多了。
T
Thorondor
大约 3 年
25 楼
听起来楼主似乎是亚麻某org的。调参和特征工程确实比较枯燥,争取数据上量吧,上
大数据平台跑起来。
请输入帖子链接
收藏帖子
某大厂ML组scientist,主要做fraud detection
但又不是真的research team,平常工作主要是做feature,train model,deploy
model
然后汇报这个AUC/ROC提高了多少
但尴尬的是,真的涉及到production pipeline的东西,并不懂
因为我们只是user用API,有专门的SDE和engineering team负责技术上的东西
平常甚至连production code都不用写,jupyter notebook可以处理大部分工作了
peer presure很大,大家都是PhD,都挖空脑袋claim如果用了这个CNN那个GAN这个BERT神马的,会带来AUC多大的提高…… 自己又是半路出家的(虽然,绝大部分人也是抄书,真的有能力自己提出algorithm恐怕也会有更好出处)
这么下去是不是只能往PM转了?
只会写jupyter python的DS phd fresh。我叫他们业余时间写个算法预测spy之软件。
自己找
个数据源做好后端。然后放android手机上。手机app之icon按一下出来UP或者DOWN二字之一。然后用另一个程序算准确率。不靠近50%则找出错误。
不管再小的软件,哪怕是个notepad。先能自己写出来能用的release,
然后你会有别的想法。自己应能找到职业发展的答案。
没有代码能自理这个基础,考虑什么也没用。PM必然也做不好。
good luck。
【 在 moonrain (Just One Night) 的大作中提到: 】
: 某大厂ML组scientist,主要做fraud detection
: 但又不是真的research team,平常工作主要是做feature,train model,deploy
: model
: 然后汇报这个AUC/ROC提高了多少
: 但尴尬的是,真的涉及到production pipeline的东西,并不懂
: 因为我们只是user用API,有专门的SDE和engineering team负责技术上的东西
: 平常甚至连production code都不用写,jupyter notebook可以处理大部分工作了
: peer presure很大,大家都是PhD,都挖空脑袋claim如果用了这个CNN那个GAN这个
BERT
: 神马的,会带来AUC多大的提高…… 自己又是半路出家的(虽然,绝大部分人也是抄书
: ,真的有能力自己提出algorithm恐怕也会有更好出处)
: ...................
recommendation和fraud detection两个应用会长久,招人还是挺看重经验的。如果自
己创新不够,就学习中国公司的做法。多开些会,networking, 看看别人怎么做的。
【 在 moonrain (Just One Night) 的大作中提到: 】
: 某大厂ML组scientist,主要做fraud detection
: 但又不是真的research team,平常工作主要是做feature,train model,deploy
: model
: 然后汇报这个AUC/ROC提高了多少
: 但尴尬的是,真的涉及到production pipeline的东西,并不懂
: 因为我们只是user用API,有专门的SDE和engineering team负责技术上的东西
: 平常甚至连production code都不用写,jupyter notebook可以处理大部分工作了
: peer presure很大,大家都是PhD,都挖空脑袋claim如果用了这个CNN那个GAN这个
BERT
: 神马的,会带来AUC多大的提高…… 自己又是半路出家的(虽然,绝大部分人也是抄书
: ,真的有能力自己提出algorithm恐怕也会有更好出处)
: ...................
这已经是最好的职位了,去哪个公司都吃香喝辣
现在是jupyter notebook,过去是matlab...R,etc。
搞算法调参数的phd,确有不少代码不能自理,打字一个个按的。
如果不想办法,不然别说老印了,本版的helpme之流都会骑在头上。
越是phd越是被欺负。吃香喝辣的日子很难持续。
楼主能描述清楚软件人员与DS人员之掌控范围之不同,
必然已经发生过了不少龌龊。然后学会了。----这是学校学不到的。
【 在 fantasist (一) 的大作中提到: 】
: 这已经是最好的职位了,去哪个公司都吃香喝辣
这个竞争很剧烈吧?很难想象一队队phd,用jupyter notebook提高AUC的场景。
【 在 lightroom (吃一条鱼,思考一个问题,法号三丰) 的大作中提到: 】
: recommendation和fraud detection两个应用会长久,招人还是挺看重经验的。如果自
: 己创新不够,就学习中国公司的做法。多开些会,networking, 看看别人怎么做的。: BERT
新东西都从用jupyter notebook/lab的phd那里来啊,说实话挺好用的。
整production code比较无趣,整production code的也很想玩下jypyter notebook上面的fancy 玩意的。
【 在 chebyshev (......) 的大作中提到: 】
: 只会写jupyter python的DS phd fresh。我叫他们业余时间写个算法预测spy之软件。
: 自己找
: 个数据源做好后端。然后放android手机上。手机app之icon按一下出来UP或者DOWN二字
: 之一。然后用另一个程序算准确率。不靠近50%则找出错误。
: 不管再小的软件,哪怕是个notepad。先能自己写出来能用的release,
: 然后你会有别的想法。自己应能找到职业发展的答案。
: 没有代码能自理这个基础,考虑什么也没用。PM必然也做不好。
: good luck。
: BERT
google ads组优化CTR快20年了,每季度都有improvement. 以几何级数增长,现在是不是要比100%还多了?哈哈,还是不怎么高。你们想过为什么吗?所以有的搞。只是一方面。
另一方面,我给年轻ML managers的建议是,一定不要KPI就是增加准确率,半年一年就没什么意思,而且压力大,组里的气氛毒性变大。一定要不断寻找新的ML问题。所以主要是managers的问题。
【 在 chebyshev (......) 的大作中提到: 】
: 这个竞争很剧烈吧?很难想象一队队phd,用jupyter notebook提高AUC的场景。
guvest啥话题都来胡扯一通,明显没见过大公司是怎么做ml的。从modeling到
productionize到ml infra,整个tech stack里搞jupyter是最爽的那类,因为想点idea就能生产impact,比起prod和infra烂活少多了。
楼主的问题在于peer pressure,觉得争credit拼不过其它吃苦耐劳的phd们,升级难。我猜大概率在f。去文化好点的大厂或者竞争没那么激烈的方向可以缓解;或者带着业
界顶尖的modeling知识,去小公司拉团队走m-track也不错。
【 在 repast (xebec) 的大作中提到: 】
: 新东西都从用jupyter notebook/lab的phd那里来啊,说实话挺好用的。
: 整production code比较无趣,整production code的也很想玩下jypyter notebook上面
: 的fancy 玩意的。
there is always a choice。你们这里工资也高是吧。如果你只care研究的品味,可以换个真正像FAIR这样的部门。
【 在 moonrain (Just One Night) 的大作中提到: 】
: 某大厂ML组scientist,主要做fraud detection
: 但又不是真的research team,平常工作主要是做feature,train model,deploy
: model
: 然后汇报这个AUC/ROC提高了多少
: 但尴尬的是,真的涉及到production pipeline的东西,并不懂
: 因为我们只是user用API,有专门的SDE和engineering team负责技术上的东西
: 平常甚至连production code都不用写,jupyter notebook可以处理大部分工作了
: peer presure很大,大家都是PhD,都挖空脑袋claim如果用了这个CNN那个GAN这个
BERT
: 神马的,会带来AUC多大的提高…… 自己又是半路出家的(虽然,绝大部分人也是抄书
: ,真的有能力自己提出algorithm恐怕也会有更好出处)
: ...................
g brain,fair这些不是想进就能进。不过楼主已经有一些ml background,有一点去打杂的机会
【 在 Caravel (克拉维尔) 的大作中提到: 】
: there is always a choice。你们这里工资也高是吧。如果你只care研究的品味,可以
: 换个真正像FAIR这样的部门。
: BERT
我上星期刚与三番一家大公司VP, fellow开会。可能要合作ML项目。各家有所不同。你認為我一無所知那就錯了。還沒ds這學科的時候我就在最大的公司做了十年算法。
我現管的也有ds phd。
你熟悉jupyter notebook么?如果我没记错,我是本版最早折腾这玩意的人之一。那要回到2015年了。找我当年literature programming 的笔记就知道问题出在哪了。技术
上也有原因,不可避免會反映出來。那時候哪有什麼大廠人用jupyter notebook。
你也可找個product line我看看其方向,我免費算一
卦。過兩年看結果。是不是胡扯,咱算個準確率。
【 在 fantasist(一) 的大作中提到: 】
<br>: guvest啥话题都来胡扯一通,明显没见过大公司是怎么做ml的。从
modeling到
<br>: productionize到ml infra,整个tech stack里搞jupyter是最爽的那类,因为想
点idea
<br>: 就能生产impact,比起prod和infra烂活少多了。
<br>: 楼主的问题在于peer pressure,觉得争credit拼不过其它吃苦耐劳的phd们,升
级难。
<br>: 我猜大概率在f。去文化好点的大厂或者竞争没那么激烈的方向可以缓解
;或者
带着业
<br>: 界顶尖的modeling知识,去小公司拉团队走m-track也不错。
<br>
可查下我之前的舊帖。折腾了好几年jupyter notebook。
旧帖也许仍有參
考價值。tool的問題,技術上的東西會帶到管理。
说实话要真想有主流AI/ML領域之新的idea,我觉得那還是得Cpp。工具會限制人的思維
。我做
工業項目,則要用C。
诸位不妨帮我挑挑错。看我当时的帖是否过时了,需要更新知识。
另外例如你是软件背景的人。接到了很好用的notebook。那notebook之作者多半对软件也是很了解的。不然你作为用户,不会被pleased。这跟能设计好api的人,要有软件积累类似。楼主缺的可能就是这方面的功夫。盯着AUC长远来看不是个办法。
【 在 repast(xebec) 的大作中提到: 】
<br>: 新东西都从用jupyter notebook/lab的phd那里来啊,说实话挺好用的。
<br>: 整production code比较无趣,整production code的也很想玩下jypyter notebook上面
<br>: 的fancy 玩意的。
<br>
不同用户数量级之下,比较同一个指标,这个統計可能會有misleading吧?
看上去是同一个问题,数据规模不同。那可能就是本质不同的问题了。
这几十年。用戶飛速增長。广告客户飞速增长。
goog能保持住20
年前的点击率已经相当厉害了。这方面地球上可能没其他公司能做到更好。
【 在 lightroom(吃一条鱼,思考一个问题,法号三丰) 的大作中提到: 】
<br>: google ads组优化CTR快20年了,每季度都有improvement. 以几何级数增长,现
在是不
<br>: 是要比100%还多了?哈哈,还是不怎么高。你们想过为什么吗?所以有的搞。只
是一方
<br>: 面。
<br>: 另一方面,我给年轻ML managers的建议是,一定不要KPI就是增加准确率,半年
一年就
<br>: 没什么意思,而且压力大,组里的气氛毒性变大。一定要不断寻找新的ML问题。
所以主
<br>: 要是managers的问题。
<br>
显然是做搜索推荐的,就是这个情况
【 在 chebyshev (......) 的大作中提到: 】
: 这个竞争很剧烈吧?很难想象一队队phd,用jupyter notebook提高AUC的场景。
:
: 【 在 lightroom (吃一条鱼,思考一个问题,法号三丰) 的大作中提到: 】
: : recommendation和fraud detection两个应用会长久,招人还是挺看重经验的。如
果自
: : 己创新不够,就学习中国公司的做法。多开些会,networking, 看看别人怎么做的。
: : BERT
如果你想比開會能力,你和他明顯還有差距,否則你不會還在羨慕什麼跑Jupyter
notebook的。
你屬於那種做云的時候是做收費的,做ML的時候是寫UI的,什麼大廠都呆過,hot的
area都做過,但是都是打雜的那種。問題是,廠很大,area hot和你有什麼關係嗎?
【 在 fantasist (一) 的大作中提到: 】
: guvest啥话题都来胡扯一通,明显没见过大公司是怎么做ml的。从modeling到
: productionize到ml infra,整个tech stack里搞jupyter是最爽的那类,因为想点
idea
: 就能生产impact,比起prod和infra烂活少多了。
: 楼主的问题在于peer pressure,觉得争credit拼不过其它吃苦耐劳的phd们,升级难。
: 我猜大概率在f。去文化好点的大厂或者竞争没那么激烈的方向可以缓解;或者带着业
: 界顶尖的modeling知识,去小公司拉团队走m-track也不错。
只从技术来考虑。我是2015年开始折腾notebook的。几年后去了软件公司,反而新的发展没有时间follow。听听新的观点也不错。
旧雨新知,都有好处。
【 在 netghost(Up to Isomorphism) 的大作中提到: 】
: 如果你想比開會能力,你和他明顯還有差距,否則你不會還在羨慕什麼跑
Jupyter
: notebook的。
: 你屬於那種做云的時候是做收費的,做ML的時候是寫UI的,什麼大廠都呆過,
hot的
: area都做過,但是都是打雜的那種。問題是,廠很大,area hot和你有什麼關係嗎?
: idea
不管你做什麼方向的,只要你能抓住第一性的東西還能有點實際產出,不可能日子難過。
【 在 guvest (我爱你老婆Anna) 的大作中提到: 】
: 只从技术来考虑。我是2015年开始折腾notebook的。几年后去了软件公司,反而新的发
: 展没有时间follow。听听新的观点也不错。
: 旧雨新知,都有好处。
:
: 如果你想比開會能力,你和他明顯還有差距,否則你不會還在羨慕什麼跑
: Jupyter
:
: notebook的。
:
: 你屬於那種做云的時候是做收費的,做ML的時候是寫UI的,什麼大廠都呆過,: hot的
:
: area都做過,但是都是打雜的那種。問題是,廠很大,area hot和你有什麼關係
: 嗎?
: ...................
你做了啥,有资格看不起收费的?aws usage metering team 10年前就要处理海量的数据。
论扯淡能力,guvest在版上说第二,估计没人会说自己第一。但把才能用来整天灌水也是白瞎了。
【 在 netghost (Up to Isomorphism) 的大作中提到: 】
: 如果你想比開會能力,你和他明顯還有差距,否則你不會還在羨慕什麼跑Jupyter
: notebook的。
: 你屬於那種做云的時候是做收費的,做ML的時候是寫UI的,什麼大廠都呆過,hot的
: area都做過,但是都是打雜的那種。問題是,廠很大,area hot和你有什麼關係嗎?: idea
我可沒看不起收費的,問題是第一你不是收費的,你是做收費工具的,做收費工具其實我也沒看不起。第二是你既然是做週邊的你就不能用core的姿態來說別人懂還不懂,尤其是說怎麼在公司最好混的種事情。
【 在 fantasist (一) 的大作中提到: 】
: 你做了啥,有资格看不起收费的?aws usage metering team 10年前就要处理海量的数
: 据。
: 论扯淡能力,guvest在版上说第二,估计没人会说自己第一。但把才能用来整天灌水也
: 是白瞎了。
这就是你们不懂大公司的地方。一是既然已经变成大公司,核心产品基本固定,从零到一的机会很少,挑新产品做失败的风险极高。楼主看起来是比较新的人,只有两条路,要不带着domain knowledge去小地方赌,要不就去日子好过的地方混,内卷已经起来的地方再努力也没出路。二是所有的pillar都细分成很多组,不管是底下打杂的还是
上边画饼的,谁离开都可能随时补上。像你可能觉得自己有两把刷子,小公司离了你就混不下去,这种事在大公司是不会发生的,牛逼轰轰没意义,平时还是别有自己扛起了一个domain这种幻想比较好。
【 在 netghost (Up to Isomorphism) 的大作中提到: 】
: 我可沒看不起收費的,問題是第一你不是收費的,你是做收費工具的,做收費工具其實
: 我也沒看不起。第二是你既然是做週邊的你就不能用core的姿態來說別人懂還不懂,尤
: 其是說怎麼在公司最好混的種事情。
我以前所在的大公司离了我就在一个领域混不下去了。这是我的看法。是否正确,尚待时间来验证。
我走之后三年换了三任Product line manager。design, FW, software tool, app
manager不知换了多
少。半年一次re org。
前不久换senior VP。有人找我。我说我们都在认识真理的路上。
没有炫耀的意思.你当故事看笑笑就好。
我的意思是:即便在大公司当螺丝钉,(尤其是年轻人)也没有理由限制自己的想象力
。十年时间走到领域第一排完全doable 。
为何你不行?
你不行别人就不行?
这些俗见毫无意义。实际上这些俗见才是未验证的illusion。
稍加思考就知道不可靠。
【 在 fantasist(一) 的大作中提到: 】
<br>: 这就是你们不懂大公司的地方。一是既然已经变成大公司,核心产品基本固定,
从零到
<br>: 一的机会很少,挑新产品做失败的风险极高。楼主看起来是比较新的人,只有两
条路,
<br>: 要不带着domain knowledge去小地方赌,要不就去日子好过的地方混,内卷已经
起来的
<br>: 地方再努力也没出路。二是所有的pillar都细分成很多组,不管是底下打杂的还是
<br>: 上边画饼的,谁离开都可能随时补上。像你可能觉得自己有两把刷子,小公司离
了你就
<br>: 混不下去,这种事在大公司是不会发生的,牛逼轰轰没意义,平时还是别有自己
扛起了
<br>: 一个domain这种幻想比较好。
<br>
我刚看了下。好像周五INTC 股票居然跌了5%。
不知道是不是把TLB焊死的缘故。
还是因为我这两星期吐槽造成的。
【 在 fantasist(一) 的大作中提到: 】
<br>: 你做了啥,有资格看不起收费的?aws usage metering team 10年前就要处理海
量的数
<br>: 据。
<br>: 论扯淡能力,guvest在版上说第二,估计没人会说自己第一。但把才能用来整天
灌水也
<br>: 是白瞎了。
<br>
同在某大厂做ml方面的。我觉得不钻算法(或者没这个能力的)的ds或者ml scientist还是不要花太多时间在提高什么auc或者pr上面, 你可以多熟悉熟悉你这个领域的
business logic,找到一些全新的问题。前者无非就是增高1%,或者2%, who
cares。 后者好歹是从0到1,影响大多了。
听起来楼主似乎是亚麻某org的。调参和特征工程确实比较枯燥,争取数据上量吧,上
大数据平台跑起来。