大pharm做ML?

A
Andyst
楼主 (未名空间)

小弟最近刚接触pharm的工作,原来从来没考虑过这些,希望上来问一下。

背景是计算生物背景phd,CS做的比较多。其实phd毕业的时候可以刷题去当码农但是当时比较想做学术所以如今在postdoc,加上刚好意外拿到了一个不错的博士后offer。如今工作内容都是如何把ML应用到生物问题。为了发paper数据分析也会顺手做一点。

因为博士后paper发得很不顺,老板主动建议我去找找工业界工作。如今各个方向都投
了一下,其中一个药厂因为我老板写了封邮件,大头直接跟我约了个chat然后当场同意给我offer了,身份也说不是问题但是催我赶紧接offer让他们律师开始接手。我下周会跟HR聊。

大pharm下的ML部门,属于蹭热点新开的一个部门所以大肆招人,我看里面的人各类都
有,有完全生物背景转过来的,有之前做生信跑各种软件的,也有纯cs背景的phd但是
做过一些生物医学数据的。地点在湾区,薪水我目前还没跟HR聊但是探口风感觉整个
200k附近吧。据说我这种entry level band最高可以到180k的base?不过我觉得有点
too good to be true. 我感觉这个的好处是他们大头点名要我是不是有点可以抱大腿
的意思?但是实际大头手下估计将近100人我也没多少机会直接跟他汇报。我想问下这
种情况如何跟HR谈?因为完全没工作经验所以也不知道这种情况下我应该跟HR谈啥?
postdoc做了两年是不是会跟fresh phd同等待遇?

其他选择是,目前还有小的ml+biomed的那种start-ups的面试,但是感觉里面如果做的不行的还不如去这个大厂,可能只会面自己觉得比较有趣的吧。这个经济背景下也不知道这些小公司能活多久。

此外就是纯tech公司的职位,听说能有250-350k,但是目前这个就业形势也不太好,而且我在学术界呆太久paper也不是tech公司关心的那类。这个我也没底。
m
mylastword

看重包裹 ML水平过硬的话 能去tech去tech 包裹职业发展都完爆药厂那点工资 以后要想去药厂也okay 药厂号称做ML的半路出家的多 对ML技术要求没那么高 做的也都是探
索性项目不是核心业务 感觉你的兴趣在药厂 不过如果去的话要有正确的期望
A
Andyst


【 在 mylastword (KK) 的大作中提到: 】
: 看重包裹 ML水平过硬的话 能去tech去tech 包裹职业发展都完爆药厂那点工资 以后要
: 想去药厂也okay 药厂号称做ML的半路出家的多 对ML技术要求没那么高 做的也都是探
: 索性项目不是核心业务 感觉你的兴趣在药厂 不过如果去的话要有正确的期望

感谢回复。我是的确希望做得更ML一些,目前翻了一下他们那边人的背景,我觉得我比里面大多数人更偏ML/CS。但是现在这个时间点上,tech招人情况也很难说,而且我有
点身份问题还不知道tech会不会管。这边大老板倒是挺痛快地同意了,所以多少也是个缓冲机会,只害怕做久了爬不出来了。

而且个人来说,的确对药物更有兴趣一些,此外我不知道赌一下AI对pharm的影响是不
是对的,毕竟现在tech也是在不停地挖掘新领域来增长。不过30年前赌理性药物设计的都翻车了。。。

o
outman2018

gsk.ai?

如果想ML一些还是建议早起去tech公司,谷歌微软这些都有做生物医药相关ML的人。另外tech公司和初创的经济效益会可观一些。

【 在 Andyst (Andy) 的大作中提到: 】
: 小弟最近刚接触pharm的工作,原来从来没考虑过这些,希望上来问一下。
: 背景是计算生物背景phd,CS做的比较多。其实phd毕业的时候可以刷题去当码农但是当
: 时比较想做学术所以如今在postdoc,加上刚好意外拿到了一个不错的博士后offer。如
: 今工作内容都是如何把ML应用到生物问题。为了发paper数据分析也会顺手做一点。
: 因为博士后paper发得很不顺,老板主动建议我去找找工业界工作。如今各个方向都投
: 了一下,其中一个药厂因为我老板写了封邮件,大头直接跟我约了个chat然后当场同意
: 给我offer了,身份也说不是问题但是催我赶紧接offer让他们律师开始接手。我下周会
: 跟HR聊。
: 大pharm下的ML部门,属于蹭热点新开的一个部门所以大肆招人,我看里面的人各类都
: 有,有完全生物背景转过来的,有之前做生信跑各种软件的,也有纯cs背景的phd但是
: ...................

I
IrisHer

你这背景想做ML就去tech,药厂适合没身份当过渡。要急着挂身份就先在药厂做然后骑驴找马,在湾区tech机会多
g
genetics123

pharma ML的package没你说的那么高。具体数字要看服务的division。如果是R&D的AI
部门,招人的待遇和Scientist差不多,postdoc出来的entry-level就是13万左右,厉
害的能拿到15w(这个还得是手上有ng,nbt一类的代表作和大牛实验室。),我说的这个已经是理想情况了。如果是其他服务部门,薪水完全看你能negotiate到哪个层次了,
biz/manufacturing/IT.etc部门的AI commercialization能给到16左右,但是纯
science的new hiring背景很难上去。
至于具体做的东西,和tech startup比都是边缘部门。都已经在pharma做应用了,又不是做dl研发,谈核心技术没什么意义啊,你要谈的核心是项目落地能力。

A
Andyst


【 在 outman2018 (outman) 的大作中提到: 】
: gsk.ai?
: 如果想ML一些还是建议早起去tech公司,谷歌微软这些都有做生物医药相关ML的人。另
: 外tech公司和初创的经济效益会可观一些。

谷歌和微软下面的bio其实非常小,而且也有朋友去实习了后表示不喜欢的
start-up可以考虑,但是总感觉有些是有真东西有些是混日子的,甄别起来还有点难
A
Andyst


【 在 IrisHer () 的大作中提到: 】
: 你这背景想做ML就去tech,药厂适合没身份当过渡。要急着挂身份就先在药厂做然后骑
: 驴找马,在湾区tech机会多

的确目前在考虑,起码这是个过渡方案,如果找不到别的就可以先入职过渡一下。毕竟现在招聘形势不好,有个肯给工作还解决身份的不容易
A
Andyst


【 在 genetics123 (GFP) 的大作中提到: 】
: pharma ML的package没你说的那么高。具体数字要看服务的division。如果是R&D的
AI
: 部门,招人的待遇和Scientist差不多,postdoc出来的entry-level就是13万左右,厉
: 害的能拿到15w(这个还得是手上有ng,nbt一类的代表作和大牛实验室。),我说的这个
: 已经是理想情况了。如果是其他服务部门,薪水完全看你能negotiate到哪个层次了,
: biz/manufacturing/IT.etc部门的AI commercialization能给到16左右,但是纯
: science的new hiring背景很难上去。
: 至于具体做的东西,和tech startup比都是边缘部门。都已经在pharma做应用了,又不
: 是做dl研发,谈核心技术没什么意义啊,你要谈的核心是项目落地能力。

感谢提供薪水范畴。但是我看虽然招了很多各种生物背景的人,但他们老大想要非常懂ml/cs的人,这样的话招人需要直接跟tech抢,150k也就是tech包裹的一半,毫无竞争
力了。
我跟他们内部的人聊了几次感觉的确是项目想法很多,但是应用上好像含含糊糊的,大家都是新来的,具体项目做成什么样给公司带来什么效益或者他们发了什么paper的感
觉都太早了。。。或者他们不肯说
o
outman2018

湾区那几家大pharma 的ML包裹可以有15-30w 很多小biotech 也有这么高
不过职业生涯早期要是能去tech还是会好点 之后再来pharma biotech 空间会大一点
当然这个经济情况下去大药厂也挺好 稳定轻松一些

m
mylastword

有机会进一线TECH的话 身份不应该作为考虑因素 好的TECH办身份很痛快 弄不好最后药厂和TECH外包的律师所都是同一个

【 在 Andyst (Andy) 的大作中提到: 】
: 感谢回复。我是的确希望做得更ML一些,目前翻了一下他们那边人的背景,我觉得我比
: 里面大多数人更偏ML/CS。但是现在这个时间点上,tech招人情况也很难说,而且我有
: 点身份问题还不知道tech会不会管。这边大老板倒是挺痛快地同意了,所以多少也是个
: 缓冲机会,只害怕做久了爬不出来了。
: 而且个人来说,的确对药物更有兴趣一些,此外我不知道赌一下AI对pharm的影响是不
: 是对的,毕竟现在tech也是在不停地挖掘新领域来增长。不过30年前赌理性药物设计的
: 都翻车了。。。

m
mylastword

同感 药厂做ML虽然现在比较火 是个噱头 其实比较尴尬 适合半路出家的人
【 在 genetics123 (GFP) 的大作中提到: 】
: pharma ML的package没你说的那么高。具体数字要看服务的division。如果是R&D的
AI
: 部门,招人的待遇和Scientist差不多,postdoc出来的entry-level就是13万左右,厉
: 害的能拿到15w(这个还得是手上有ng,nbt一类的代表作和大牛实验室。),我说的这个
: 已经是理想情况了。如果是其他服务部门,薪水完全看你能negotiate到哪个层次了,
: biz/manufacturing/IT.etc部门的AI commercialization能给到16左右,但是纯
: science的new hiring背景很难上去。
: 至于具体做的东西,和tech startup比都是边缘部门。都已经在pharma做应用了,又不
: 是做dl研发,谈核心技术没什么意义啊,你要谈的核心是项目落地能力。

f
fay126

ML在药厂是个边缘到不能再边缘的部门了,就像楼上几位说的,短期内(5-10年)没有项目落地的能力,也就没有任何business impact。有哪个行业能在5-10年没任何产出
还不停砸钱的呢?

个人感觉ML用到制药业有几个大骨头要啃,有不对的请指正:
1,制药业是highly regulated industry,和硬件/软件行业完全不是一个玩法,FDA不承认没有任何意义(当然工业界需要"教育"FDA,让他们慢慢接受)。
2,制药业的特点就是高门槛/高投入/长周期,现在开始砸钱,10年后能听个响就烧高
香了。有哪个上市公司能忍一个新技术10年不落地?
3,制药业的breakthrough都是建立在生物学breakthrough的基础上(比如PD-1,CART
之类的,这都还是20-30年前的breakthrough),生物学没有breakthrough,ML玩花了
也玩不出来什么太有价值的东西。

个人觉得ML有价值的地方:
1,ML现在应该主要是在early discovery阶段筛选一下molecule,提升效率。如果证明有效,这个应该是要鼓励的,而且early discovery,也没啥可regulate的。
2,想用在clinical的话,目前我能想到的就是real world evidence了,收集分析病人biometrics数据(前提是FDA承认RWE)。
3,Clinical Pharm/Biostats部门的员工多学学Data Science/CS是个好事,提升建模
能力。

A
Andyst


【 在 fay126 (牛牛) 的大作中提到: 】
: ML在药厂是个边缘到不能再边缘的部门了,就像楼上几位说的,短期内(5-10年)没有
: 项目落地的能力,也就没有任何business impact。有哪个行业能在5-10年没任何产出
: 还不停砸钱的呢?
: 个人感觉ML用到制药业有几个大骨头要啃,有不对的请指正:
: 1,制药业是highly regulated industry,和硬件/软件行业完全不是一个玩法,FDA不
: 承认没有任何意义(当然工业界需要"教育"FDA,让他们慢慢接受)。
: 2,制药业的特点就是高门槛/高投入/长周期,现在开始砸钱,10年后能听个响就烧高
: 香了。有哪个上市公司能忍一个新技术10年不落地?
: 3,制药业的breakthrough都是建立在生物学breakthrough的基础上(比如PD-1,
CART
: 之类的,这都还是20-30年前的breakthrough),生物学没有breakthrough,ML玩花了
: ...................

谢谢回复,我也谈谈我的两分钱吧

现在一个趋势就是ML/AI在想办法入侵其他行业。因为tech的东西毕竟也都做烂了,天
天提高CTR那么一点点,做什么个体化推荐,基本都是极致了。tech本身也需要依附一
些传统行业,需要一个商业模式才可以,比如说狗家就是做online ad这种,其实抢了
传统传媒系统的广告费。比如说Uber,Airbnb就是入侵了传统的出行住宿行业。我能想到tech能自己原生态赚钱的是游戏,这个的确是造出来的一个需求。

然后我觉得在制药行业,如今喊出来的口号就是利用AI/ML来降低成本提高研发效率,
这是目前主要的一个噱头和卖点。可能也有做一些诊断系统,推荐个体化用药,甚至直接做什么认知疗法一类的心理治疗。这些的确都很边缘。 至于目前ml能不能提高研发
效率,我也不知道,最老的药物理性设计感觉到头来没做出来什么,大规模人群测序+
bioinfo找靶点验证靶点过去几年似乎有点突破,但是感觉也就那样。目前我个人来看
,ml没有成熟到可以直接解决现成问题但是大家投资这个方向可能是对的,万一成功了有突破了呢。再说华尔街很喜欢这种热点,就算明知道是烧钱大家也得一起上陪着烧。

不过说做项目,我觉得目前的确这个领域有个好处就是似乎数据量很大,而且大家其实互相不公开自己的内部数据。我觉得从这个角度上来说,说不定可以做出来点东西,具体是大是小就得看天了。

f
fay126

你说的没错,tech行业就是想借着ML这把火抢别的行业的饭碗,哈哈哈。不说湾区大厂了,国内的大厂(比如鹅)也在做这方面的尝试。但是tech公司做制药口这块的人应该是没有制药经验的,不知道他们能折腾出来点啥新鲜东西,我不太看好。

另外我个人对ML还是很感兴趣的,也在读相关的degree,对本职工作还是非常有帮助的。只不过我个人还是认为制药业的breakthrough需要依靠生物学的breakthrough,ML能提供的帮助很有限。我们耐心等个5-10年,看看会不会啪啪打脸。。。
【 在 Andyst (Andy) 的大作中提到: 】
: CART
: 谢谢回复,我也谈谈我的两分钱吧
: 现在一个趋势就是ML/AI在想办法入侵其他行业。因为tech的东西毕竟也都做烂了,天
: 天提高CTR那么一点点,做什么个体化推荐,基本都是极致了。tech本身也需要依附一
: 些传统行业,需要一个商业模式才可以,比如说狗家就是做online ad这种,其实抢了
: 传统传媒系统的广告费。比如说Uber,Airbnb就是入侵了传统的出行住宿行业。我能想
: 到tech能自己原生态赚钱的是游戏,这个的确是造出来的一个需求。
: 然后我觉得在制药行业,如今喊出来的口号就是利用AI/ML来降低成本提高研发效率,
: 这是目前主要的一个噱头和卖点。可能也有做一些诊断系统,推荐个体化用药,甚至直
: 接做什么认知疗法一类的心理治疗。这些的确都很边缘。 至于目前ml能不能提高研发
: ...................

o
outman2018

Biomedical AI还是有可为的,传统的实验计算领域,ML这些data-driven的方法都在发展。论落地,蛋白/小分子的设计与优化、特性预测(GCN, meta-learning,RL etc),突变的功能注释(deepSea, Basenji, etc),knowledge graph,因果关系,病人临床试验的分类,这些论文和公司都多了去了,噱头很多,但有意思有潜力的也不少。只是药物最终的
产生环节涉及太多,不是一时半会儿的事。狗家鹅家是没数据和经验,但有钱有市场也许就有可能。

【 在 fay126 (牛牛) 的大作中提到: 】
: 你说的没错,tech行业就是想借着ML这把火抢别的行业的饭碗,哈哈哈。不说湾区大厂
: 了,国内的大厂(比如鹅)也在做这方面的尝试。但是tech公司做制药口这块的人应该
: 是没有制药经验的,不知道他们能折腾出来点啥新鲜东西,我不太看好。
: 另外我个人对ML还是很感兴趣的,也在读相关的degree,对本职工作还是非常有帮助的
: 。只不过我个人还是认为制药业的breakthrough需要依靠生物学的breakthrough,ML能
: 提供的帮助很有限。我们耐心等个5-10年,看看会不会啪啪打脸。。。

g
genetics123

说的很到位。pharma有自己的compliance和行业特点。目前ML在各个部门要么是
bioinfo转过来的(R&D),要么是Stats转过来的比如你提到的RWD,甚至有些RWD部门
连ML的人都没有,清一色的Stats SAS programmer。
个人对ML在R&D不是特别看好,除了有一些固定的领域比如graph NN药物结构分析,次
一级的genomics,但并不觉得会outperform bioinformatics。
倒是对RWD或者商业部门有那么一点期待,毕竟有一些领域不是直接和FDA打交道,比如patient recruitment,speed up clinical trial,RWE在FDA也慢慢有一些认可.etc

【 在 fay126 (牛牛) 的大作中提到: 】
: ML在药厂是个边缘到不能再边缘的部门了,就像楼上几位说的,短期内(5-10年)没有
: 项目落地的能力,也就没有任何business impact。有哪个行业能在5-10年没任何产出
: 还不停砸钱的呢?
: 个人感觉ML用到制药业有几个大骨头要啃,有不对的请指正:
: 1,制药业是highly regulated industry,和硬件/软件行业完全不是一个玩法,FDA不
: 承认没有任何意义(当然工业界需要"教育"FDA,让他们慢慢接受)。
: 2,制药业的特点就是高门槛/高投入/长周期,现在开始砸钱,10年后能听个响就烧高
: 香了。有哪个上市公司能忍一个新技术10年不落地?
: 3,制药业的breakthrough都是建立在生物学breakthrough的基础上(比如PD-1,
CART
: 之类的,这都还是20-30年前的breakthrough),生物学没有breakthrough,ML玩花了
: ...................

e
ebblood

非常同意,也认为药厂的ml, advanced analytics 发展方向在commercial 和
operation

【 在 genetics123 (GFP) 的大作中提到: 】
: 说的很到位。pharma有自己的compliance和行业特点。目前ML在各个部门要么是
: bioinfo转过来的(R&D),要么是Stats转过来的比如你提到的RWD,甚至有些RWD部门
: 连ML的人都没有,清一色的Stats SAS programmer。
: 个人对ML在R&D不是特别看好,除了有一些固定的领域比如graph NN药物结构分析,次
: 一级的genomics,但并不觉得会outperform bioinformatics。
: 倒是对RWD或者商业部门有那么一点期待,毕竟有一些领域不是直接和FDA打交道,比如
: patient recruitment,speed up clinical trial,RWE在FDA也慢慢有一些认可.etc: CART