谷歌新人李飞飞:击碎玻璃天花板的华裔女科学家(图)

今日头条
Toutiao
最新回复:2017年12月13日 13点49分 PT
  返回列表
63705 阅读
32 评论
机器之心
本周二,谷歌宣布斯坦福大学华裔教授成为谷歌人工智能团队新任领导者
。作为第一代中国移民,这位图像识别领域的杰出学者是如何从普林斯顿进入斯坦福,最后成为谷歌人工智能团队新任领导者的?让我们来了解一下这名华裔学者实现美国梦的传奇经历吧。


1976 年,李飞飞出生于北京,后来在四川长大

如果你真想做一件事,全世界都会来帮你。16 岁刚来美国的那两年,李飞飞却只能从依靠自己开始。在帕西悉尼的白人圈子中,这位亚裔姑娘显得有点孤独,她像所有极客一样过着简单的生活。那个时候打工与学习几乎占据了她所有的时间。李飞飞明白,这就是普通新移民的生活,需要点牺牲和决心。幸运的是她的同学和高中数学老师在这时给了她莫大鼓励和帮助。

1995 年,李飞飞进入普林斯顿大学攻读物理学,生活的大门终于渐渐为她打开。在周一到周五,她是普林斯顿物理系拿着高额奖学金的高材生,周末则必须回到 Parsippany 的洗衣房,置身于成堆的衣服中。她说「我爱普林斯顿。」因为这里有全世界最优秀的年轻天才。

然而生活的艰辛也在随着年龄增长,她见过斯坦福的优秀博士毕业生为一张绿卡四处奔波,那时的她不明白也无法想象一张绿卡,一个留在美国的机会能难倒全世界那么多优秀的人才。

有过移民经历的人对平等有着更加深刻的体会,李飞飞也如此,她坚持主张高科技产业性别平等,支持种族多样化,还有反对特朗普。她曾在 Twitter 上调侃特朗普是个不懂科学没有眼界的人。

李飞飞说:「多样化的危机,也正是我们的社会正在应对的危机。『科技是没有灵魂的吗?』」她坦承自己对 AI 研究界的失望,因为这一领域不太欢迎不具代表性的少数群体。在她工作的部门里一共有 15 名全职人员,她是唯一的女性。梦想与责任

并不是每个美国移民都能实现自己的梦想,但李飞飞做到了。当初她随父母举家搬到大洋彼岸。「他们来到这个国家是为了追求梦想。」李飞飞认为她也「应该能够追求自己的梦想。」这个「应该与能够」的选择做起来并不轻松。

1999 年,李飞飞从普林斯顿大学毕业,那时的华尔街一片辉煌,互联网泡沫的热潮接近顶峰,李飞飞接到了多家金融公司的工作邀请。然而她却没有从中选择任何一份工作来减轻家庭经济负担。她的父母支持她做出了最后选择,去西藏研究藏医。

虽然李飞飞知道自己终将回到学校,回到科研工作中来,读博士也是她的梦想,但西藏之行并非人生插曲。

在科学界藏医与中医一样存在很多争议,但这并不妨碍李飞飞对它的兴趣。她在媒体采访中提到,作为一个科学家,藏医可以在哲学和方法论层面上给她给多的理解。她非常看重具体科研项目在更大领域范围内的意义,每一项研究开始之前都要经过深思熟虑。


她曾经放弃高盛的 offer,追随梦想来到西藏

在李飞飞后来写给博士生们的信中可以看到她对科学探索的态度:

每个领域的每一篇论文都应该以独特的新视角进行研究。所以当你在机械地开展你们的工作前,请扪心自问——『我的研究会重新定义这一领域的未来吗?』这意味着发表论文的意义不是『这个方向没有人写过』,或者『让我来解决这个小问题,它的成果会很容易展示』;研究意味着『如果我做了,这一重大问题就有了更好的解决方案』,『如果我做了,我就真正开拓了这一领域』。你的研究成果应该能被很多人和行业直接使用,换句话说,你的选题应该有很多『客户』,你的解决方案应该是他们想要的。

西藏归来之后,李飞飞开始了加州理工的博士学业。博士期间母亲接连患上了癌症与中风,那是一段艰苦的日子,李飞飞说,「我们经历了很多困难,然后一起挺过来了。既要担起生活的责任,又要对得起自己的梦想」。改变图像识别方向的人

是什么吸引谷歌一次性将李飞飞和她的门生李佳一齐请进公司,并委以重任的?显然是她的学术成就和影响力。

自 2009 年以来,李飞飞一直担任斯坦福人工智能实验室和斯坦福视觉实验室的负责人,并成为了终身副教授。在她 2014 年的简历上,有 95 篇在 Nature、PNAS、Journal of Neuroscience、CVPR、ICCV、NIPS 等顶级期刊与会议上发表的文章;联合发表的文章有 32 篇。从 2015 年到 2016 年,李飞飞署名发表的论文有 33 篇(斯坦福视觉实验室),还有一篇将在 2017 年发表在 CSCW 会议上。

在不就之前,艾伦人工智能研究所推出了以人工智能为基础的免费学术搜索引擎。我们使用该引擎生成了李飞飞的论文引用量图解(注:搜索时请注意名字输入格式,Feifei Li 为另一位作者。),如下:



过去 3 年,李飞飞论文的平均引用量为 6738。


基于可用数据,Semantic Scholar 估计李飞飞的引用量在 33215 到 44773 之间。

回溯过去,李飞飞在计算机视觉上的研究已经花费了 15 年。

在 2007 年,李飞飞和一位同事着手开始一项庞大的任务,为来自互联网的十亿张图片进行分类、打标签,从而为计算机提供样本。其中理论基础是如果机器观察到足够的事物,它们就能够在现实世界进行识别。

他们使用亚马逊 Mechanical Turk 这样的众包平台,邀请了来自 167 个国家的 5 万人帮助为其中的数百万张图像打标签。

最终,他们建立了 ImageNet 数据集。今天,这个数据集包含了使用日常英语标记的超过 1400 万张图像,跨越 21,800 个类别。

在我们用 Semantic Scholar 生成的图解中发现,李飞飞被引用最多的论文就是她于 2009 年在 CVPR 上发表的《ImageNet: A large-scale hierarchical image database》。


瓜分学界人才的科技巨头们

谷歌的云业务负责人 Diane Greene 在新闻发布会上说,李飞飞和李佳的加入是谷歌正式将人工智能集团业务正式化的一部分。此后,该团队不会只专注于人工智能研究,而是致力于将尖端技术融入各种 Google Cloud 产品,例如让公司预测销售情况的软件。

而在宣布成立人工智能集团之前,谷歌还围绕着云服务部门产品路线图发布了一系列产品,介绍了他们如何扩大机器学习的使用。对于云计算来说,机器学习是一项关键的技术,它能训练大规模的 AI 网络,不断自我学习和提升。

Google Cloud 及其机器学习团队的产品经理 Rob Craft 也表示,这两名研究者将帮助谷歌「将机器学习的力量带入其他行业」,他们也将成为谷歌整合其研究单位及核心业务努力的一部分。

但是,雇用具有机器学习和相关任务专业知识的人才并不便宜。这一行业内的激烈竞争导致谷歌这样的大公司经常会支付「NFL 球员签字费」级别的巨额资金,而越来越多的顶级学界研究人员也陆续加入了大公司的怀抱。

近年来,学界内众所周知的大牛们基本被科技巨头筛了个遍,方式也是各种各样。

最初,谷歌先是收购了多伦多大学的一家初创公司 DNNResearch。但实际上,这家公司只有三个成员,Geoffrey Hinton 和他的两个刚毕业的、曾经赢得 2012 年的 ImageNet 大赛的学生——Alex Krizhevsky 和 Ilya Sutskever(现在加入了 OpenAI)。

如今被称为谷歌最成功一笔收购的 DeepMind 也是竭尽全力的在挖空英国的人工智能人才。前几日 Business Insider 的一篇文章指出,牛津大学与剑桥大学最优秀的人工智能人才一直在被科技巨头收拢。

而且在文章中重点提到,虽然微软和 Facebook 这样的美国科技巨头也正在招募牛津大学的研究生和教授,但是 DeepMind 似乎比其他的公司挖到的人才更多。DeepMind 从被谷歌收购了之后就已经把它的团队规模从在国王十字路时的 100 人扩大到了大约 250 人。

不只是谷歌,以美国、中国为主力的科技巨头们正如同「风暴之眼」一般吸纳着一切尽可能的能量推动着公司在人工智能道路上的快速发展。

微软在人工智能研究中一直处于第一梯队,在 9 月底宣布组建 5000 人规模的专注人工智能的工程和研发团队 Microsoft AI and Research Group。

之前我们觉得已然落后了的苹果,在 作为该公司人工智能研究的负责人,开始招聘人才、组建团队。

中国的 BAT 三巨头。百度因为有吴恩达,「声音」是最大的,我们对他们的人工智能研究也是了解最多的(开源深度学习框架 Paddle、硬件基准测算工具 DeepBench 等)。

阿里在今年的云栖大会上也「秀」了一把人工智能。

腾讯也在最近成立了腾讯 AI Lab,新一轮的招兵买马不可避免。虽然在他们对腾讯 AI Lab 没谈到太多内容,但隐隐可察觉出腾讯也要像谷歌一样在人工智能与自己的平台和产品结合上打通一条道路。

在接近尾声的 2016 年,我们已经明显感觉到人工智能、机器学习、深度学习等字眼成为了科技界的主流。从害怕 AlphaGo 之后因过度炒作而经历新一轮寒冬,到语音识别、神经机器翻译等的一个又一个的技术突破,再到越来越激烈的人才竞争,一个新的时代即将到来。
令胡冲
1 楼
这天花板太低了吧。:) 李飞飞文章写了不少。但斯坦福九年一直副教授。再说,看不出来给十亿图像标注分类有什么意义。人作研究挺不错,但要吹过头了,只能伤害自己。
f
freeda6
2 楼
做研究和做工程不一样。
雨过天晴2011
3 楼
院士后选人!
z
zing20
4 楼
华裔在职场的天花板可真低!即使是疼校毕业也照样不管用。
比格犬
5 楼
“十亿图像注册分类有什么意义”—- 无知着无畏
转帖司令
6 楼
这是纯粹借表扬来黑人家的节奏
老头衫
7 楼
各个时代豆油弄潮儿,时也运也 , carnegie 时代,研究钢水的科学家应该比今天的粒肥费还牛比,毕竟当初房子才5000块钱一栋 我们看客应该以平常心看待这些所谓的精英,时也运也,她不一定智商高过你我,她也不一定比你我努力,但她赚的钱,影响力,可能比你我都大
令胡冲
8 楼
华裔也有王安那样的能人啊。 ImageNet要真有用,自己集资做公司好了,斯坦福那么多年副教授还用给人打工啊。做个公司让谷狗收购不更好。:)
y
youdaoli
9 楼
求扫盲: 她做了啥可以留给后人的工作了?10亿图像注册分类?很快就会又有100亿图像来了,还能做么?
远方的风
10 楼
斯坦福副教授的职位最好不要辞,打工不是那么好混的,分分钟都会有被撸下去或者扫地出门的可能。
方川
11 楼
在美国把名字写成Li Fei-Fei真不容易。
b
bashfulx
12 楼
很会讲话 Ted Talk 很成功
比格犬
13 楼
图片注册分类可以让AI自动学习,图片越多越好,这样AI学习后可以自动认图片. 这个和阿发狗会下围棋道理相似
I
ILHP
14 楼
有一和親成功例子.
令胡冲
15 楼
AI早就可以认图片了。二维识别25年前286机子就能做了。没有人需要从小看十亿图片才会看事物,同理,AI也一样。强行灌输,表明没有方法突破。浪费资源。这才是研究人员的价值。 Google云虽然有tensorflow,但AWS云识别器早就把该学的都大致学了一遍了,标注分类有了,然后呢,独特价值在哪里? 阿尔法狗是具体领域,两个CNN分工,各有有明确收敛目标。通用的深度学习,恐怕只是玩玩看而已。
x
xuxuzxzx
16 楼
嫁了鬼佬!
y
youdaoli
17 楼
图像太复杂了,现在还都只是小儿科游戏而已,放心吧,等到计算机能XPoker或XMAJANG时,玩图像也还只是游戏
令胡冲
18 楼
图像也已使用。中国几个小伙创立的图森公司,在美国试行大货车自动驾驶。是驴子是马,拉出来溜溜就是好样的。 AI和ANN领域,中国人才储备强大而广泛,很可能再次弯道超车。到大公司给人打工,未必是好主意。如果说不能自己集资创业,还是斯坦福教授更有前途。做自己想做的事。
n
nanxun_
19 楼
没法,谁让她是华裔呢!即使她表现出左棍倾向,但是人家还是不会狠鸟她。她要是个墨黑木,谷歌再跪求她了。
闻笑阅
20 楼
AlphaGo Zero 無人自學三日, 勝過去3000年 https://qooah.com/2017/10/20/alphago-zero/
女球迷
21 楼
AI 如果还在搞大数据的学习,那是落后的技术, 现在不是时兴小数据学习吗?
走马读人
22 楼
完成漢字與其他西方語種的特徵對接(不是現成的翻譯), 我的研究的一部分剛開始在YouTube上公佈,等到50-200集,相信領會漸增,從者雲集, 谷歌的人馬可能有意採用。
T
TexasPeter
23 楼
一年发表95篇论文?几篇她看过,跟不要说写过了。
走马读人
24 楼
公佈的第二部分仍基於數字學,但是是對其進一步分化, 沒有人提到過奇偶數字學,可以化解大多數的字, 笛卡兒有知,當首先提倡,可惜現在還未遇到。(YouTube: Shu Bethune) 大陸政治從正反兩面客觀造就我這一機運。
媚眼凤姐
25 楼
四天发一论文,篇篇都是垃圾。 谷歌近水楼台,一键引用万次。
w
wd01702
26 楼
99年华尔街会给普林斯顿物理系的本科毕业生主动发高薪邀请,你连申请都不用?即使你是班上top1%都不大可能吧。
w
wd01702
27 楼
95篇论文是14年简历上说之前发表的论文,没有说是当年一年之内,这没问题。肯定是牛人,但说当年本科毕业拒绝了华尔街的高薪邀请就有点过了。主动积极的申请,拿到一些投行的offer有可能,也很了不起。但就别说拒绝人家的邀请了。
z
zhichi
28 楼
申请了也可以拒呀,比如一下子拿到几个。
T
TheEarth
29 楼
女球迷 发表评论于 2017-12-13 17:45:07 AI 如果还在搞大数据的学习,那是落后的技术, 现在不是时兴小数据学习吗? ======================================================== 觉得现在时兴不学习。
l
lovNordstrom
30 楼
投行在招人的时候有些学校是target school,不在里target school进不了校招。你如果投资时候看fund资料,里边的fund manager, 很多是Harvard本科,再没有更多的学位了。 wd01702 发表评论于 2017-12-13 19:48:03 99年华尔街会给普林斯顿物理系的本科毕业生主动发高薪邀请,你连申请都不用?即使你是班上top1%都不大可能吧。
喝着咖啡逛文学城
31 楼
这文章有点过时了吧,吴恩达已经离开百度好几个月了,不只他,百度深度学习研究团队几个领军人物如林元庆、徐伟都在这几个月陆续离开了。
h
hanena
32 楼
学术界其实没有天花板一说。企业里才有。