“阿尔法”们来势汹汹,科学家会失业吗

w
wmrencai
楼主 (未名空间)


扫码关注未名人才公众号或微信搜索:未名人才


扫码关注未名人才Facebook


继阿尔法围棋(AlphaGo)战胜职业围棋选手李世石后,人工智能(AI)再下一城,这
次它将“目光”锁定在结构生物学。
近日,在国际蛋白质结构预测赛(CASP)中,谷歌旗下DeepMind团队的阿尔法折叠(
AlphaFold 2)摘得桂冠。
在CASP的一系列测试中,AlphaFold 2斩获92.4分,在最具挑战的自由建模蛋白质测试
中也获得87分,预测蛋白质结构的准确率甚至可以与实验方法媲美。
一时间,AlphaFold 2被“颠覆”“革命性突破”“诺奖级成果”等词汇围绕。
有人称其解决了“困扰生物学家50年的问题”,有人担忧“结构生物学家是否会因此失业”。
人工智能再次完胜人类,究竟意味着什么?

AI破解生物学难题

人体内有成千上万种不同的蛋白质,蛋白质的功能很大程度上取决于其独特的结构。
弄清楚蛋白质的折叠形状被称为“蛋白质折叠问题”。
在过去50年中,这一直是生物学界的重大挑战。
此前,生物学家主要利用X射线晶体学或冷冻电镜等实验手段来破译蛋白质的三维结构
,但这类方法耗时长、成本高。
预测蛋白质结构的CASP竞赛始于1994年,今天它已成为该领域交流新技术的国际平台。2018年,DeepMind 团队推出 AlphaFold 1参加第13届CASP竞赛,并取得不俗的成绩。
今年参赛的系统是新版本的AlphaFold 2。
此次比赛中,AlphaFold 2以高分领先,高出第二名25分。
CASP竞赛创始人之一、美国马里兰大学教授约翰·蒙特认为,人工智能预测蛋白质结构的结果与实际对照,达到90分即可与人类实验方法获得的结果媲美。
美国密苏里大学哥伦比亚分校讲座教授许东认为,AlphaFold 2可以满足95%以上的理解功能、实验设计等需求,达到了应用的标准。
夺冠当日,DeepMind在官网发布新闻稿称,对于困扰生物学界50年的“蛋白质折叠”难题,AlphaFold 2已成为业内专家认可的解决方案。
《自然》新闻评论更是以《它将改变一切》为题,指出DeepMind在解决蛋白结构问题上“迈出一大步”。
12月6日,在智识学研社与智源社区策划的“智2平方”论坛中,中国人民大学数学科学研究院教授龚新奇表示,在结构生物学领域,测蛋白质序列很容易,解析蛋白质结构很困难。
AlphaFold的出现,验证了人工智能解决这一难题的可能性,这是一项突破。
人类对蛋白质结构了解得越多,对生命科学、药物研发等的贡献越大。
清华大学生命科学学院教授王宏伟认为,这有可能为结构生物学的从业者带来“解放”:从业者不再受制于现有结构解析手段对时间、环境的高要求,能够很快拿到某个蛋白质的结构,以尽快探讨结构生物学的核心问题。
人机协同的结果

AlphaFold 1参加第13届CASP竞赛后,DeepMind团队在《自然》杂志发表文章,公开
AlphaFold 1的代码。
目前,DeepMind团队还没有发表关于AlphaFold 2的论文并公布相关数据,只在官网公
布了相关消息就引起AI领域和生物学界的轩然大波。
“AlphaFold 2的相关文章还没有看到。以我对Alpha系列的了解,应该还是集成数据驱动机器学习诸多算法的创新应用之一。”
浙江大学人工智能研究所所长吴飞告诉《中国科学报》,“这相当于从包含了无穷多种答案的空间中,通过学习、优化、搜索等技术,找到一种合适的解决方法。”
吴飞举例说,比如人类产生“恐惧”的情绪,需要在成千上万个神经元中锁定某种组合,形成某种神经回路结构,才会在功能上产生这种情绪。人类蛋白质的组成结构非常复杂,要从海量的组合中,找到某种特定的组合非常困难。
由于计算机的计算能力非常强大(可以理解为计算机的学习模式能力和穷举搜索能力强),能帮助人们从几亿个结构里,找到某个特定的结构以及该结构能对应某个特点功能。
“这是一种大数据驱动的人工智能方法,是以深度学习和搜索组合优化相结合的整体应用。”
吴飞说,“AlphaFold 2的成功基于算法、模型、算力以及该领域已有知识,这些元素
缺一不可。”
吴飞进一步解释说,AlphaFold 2在一个具体任务中取得巨大成功,也许源于其在模型
上的组合式创新。
另外,DeepMind团队也收集了一批一一对应的数据,即蛋白质的结构和功能一一对应的数据。在算力上,因为要从无穷多的组合里面,找到一个对应的功能,需要对蛋白质大数据中蕴含的模式进行学习,对可能的答案空间进行搜索,同时提高大规模计算能力,这是人机协同的胜利。
超越人类还差一大步

“目前主流的机器学习技术还依赖于统计学习。在数据量大、人工难以靠直觉分析规律的领域,相对来说人工智能具有优势。”北京航空航天大学教授李甲告诉《中国科学报》。
吴飞也强调,在某些特定领域,人工智能拥有人类无法企及的能力,特别是在以海量数据搜索为导向的领域。
“就像有一颗珍珠沉入太平洋海底,人们都知道它在里面,但就是无法锁定它的具体位置。如果依靠人力去寻找,可能就是一项无法完成的任务。但人工智能可以凭借巨大的存储能力、超强的搜索能力和对数据高效利用的能力轻而易举找到它。”吴飞说。
2016年,DeepMind团队的AlphaGo战胜围棋大师李世石,曾掀起AI界和围棋界的滔天巨
浪,AlphaGo也在很大程度上改变了人们对AI的认知。
在围棋比赛中,每一步都有一个“最优落子”的选择,人类不可能在大脑里把几十亿个落子情况都推演一遍,但是计算机就拥有这样的能力。
“AlphaFold 2和之前的AlphaGo类似,是机器学习模型的进步和算力的提升,以及‘标签数据’指导下完成的任务。”
吴飞说,“即使在某些特定领域,也不能说是‘人工智能超越了人类’,而应该叫做‘人机协同完成’。”
吴飞认为,人工智能的成功基于‘模式学习和模式匹配’能力。
比如,人们经常用到的人脸支付功能,人工智能并非精准‘识别’出你的脸,而是从几十万张人脸数据中,找到与你匹配的人脸模式。
如果它发现相似度超过90%,就判断是你。
如果问人工智能,“为什么认为这张脸是我?”“人工智能就是有嘴也解释不清。”
吴飞说,“人工智能是某些领域中非常好的工具,可以在某项任务中节省大量人力和时间,但对这个结果的利用,还要依靠人类专家来完成。如果将这种工具和人类的优势结合,协同赋能,就能加快创新,带来科学研究上的飞跃,进而改变人类生活。”
扫码关注未名人才公众号或微信搜索:未名人才


扫码关注未名人才Facebook