划重点 1.机器掌握语言后就跟人一样了,因为通过语言我们才能建立对世界的认知,才能够去思考,才能够理解文化,也才能够进行沟通,所以今天重大的突破就是反过来,不是让机器脱离人去学习,而是向人类已经有的文明学习。 2.有了ChatGPT之后,可以接受把它当做人类文明的一部分,要有一种大我的想法,也许有一天人类从肉身里面已经消亡了,但机器文明很发达,那也是人类文明的一个延续,是我们自然的一个进化。 3.我更担心的是未来巨头因为用不好机器,使得机器带来了文明的毁灭,这是我们需要担心的事情,就像核弹毁灭了世界一样的,大家可能最终聚焦在没有控制它,之后不仅是人的灭亡,也是人类文明的灭亡。 4.中国AI大模型比美国大概晚了两三年的样子。追上ChatGPT3.5的话,我觉得今年内可能就能够实现,但对于GPT-4,我认为可能需要3年左右的时间,应该不会低于两年。 作者丨叶蓁 编辑丨康晓 出品丨深网·腾讯新闻小满工作室 王小川读研究生的时候,就建立了以生物为基础的思考模式。“一个DNA的双螺旋结构,在变成人的过程当中经历了无数多复杂变化,经过了混沌的过程,最后生命才能创造这种有序,但这个事情用传统的数学物理还无法解释。” 这个认知影响了王小川的世界观。对王小川来说,看到生命的有序性后,再看其发展的轨迹,既有自由意志,也有命中注定。王小川认为,在时间的先后里面,人们只是看不见未来而已,也许结果早已注定。 “随着量子力学的发展,人的生命到底是注定的,还是能够被掌控的,有了一些新发展。ChatGPT把我们从日常繁琐的劳碌中解放出来,使我们有更多的时间去回答‘我是谁’的问题,当工具越来越强大的时候,我们越能找到自己。”王小川告诉腾讯新闻《深网》。 离开搜狗的一年半时间,王小川主要在思考用数学模型研究生命科学的难题。“生命的复杂性远超物理世界,牛顿把物理问题变成了数学问题,但生命科学领域至今做不到。”2021年,DeepMind发布了AlphaFold蛋白质结构数据库(AlphaFold DB) ,王小川认为,“生命科学领域这个突破只是解决了一小段问题的数学化。” ChatGPT的横空出世为王小川打开了另一个路径。难掩兴奋感的王小川告诉《深网》,“当我发现语言可以变成数学问题,这个模型未来也能承接对生命的探索,会成为突破生命科学的一个支点。” 王小川认为,ChatGPT已经是一个初级的通用人工智能。“NLP自然语言处理是人工智能皇冠上的明珠,语言包含的内容要去理解它是个特别大的难题。ChatGPT巧妙的是找到了新方法,这个模型掌握了人类的语言,让机器向人类已有的文明学习。当机器掌握语言之后,强人工智能可能就到来了。”王小川进一步解释。 “有了ChatGPT之后,可以接受把它当做人类文明的一部分,要有一种大我的想法,也许有一天人类从肉身里面已经消亡了,但机器文明很发达,那也是人类文明的一个延续,是我们自然的一个进化。”王小川告诉《深网》。 在王小川看来,人活着的意义就是存在,AI能够帮助人得到更大的永恒。“人类文明被机器取代了,我们早晚会接受这个事实,就像我们的孩子比我们强一样;我更担心AI巨头因为用不好机器,使得机器带来了人类文明的毁灭,就像之前核弹可能毁灭世界一样。” 对于ChatGPT学习人类的创作能力,王小川认为,未来可能会创造一个太虚幻境,以游戏和电影为核心场景,让人非常舒服和享受的沉浸在里面,它虽然有很大的意义,但不是其追求的方向。“我更希望AGI有知识,让人能够更好的和世界连接,去解决真实的问题。当它去给人做服务的时候,就把人给解放出来,回到了人本主义。” 4月10日,王小川正式对外宣布开启人工智能大模型领域创业,与前搜狗COO茹立云联合成立人工智能公司百川智能,旨在打造中国版的OpenAI基础大模型及颠覆性上层应用。百川智能早前已获得5000万美元启动资金,来自王小川与其业内好友的个人支持。 王小川认为,创业公司虽然在人才团队、资金密度跟大厂没有可比性,但是在面对未来方向时候,有可能去做大厂做不到的这种颠覆性的大产品。 以下是《深网》对话王小川实录,在不影响原意的基础上有所删减: “机器掌握语言后,强人工智能就来了” 《深网》:全球这么多科技巨头,为什么它们没做出ChatGPT? 王小川:深度学习发明之后,阿尔法狗已经给我们巨大的信心,用深度学习方法可以让机器产生一定的智能。之后我们开始追求通用人工智能(AGI,Artificial General Intelligence),不只是下棋的问题,这方面我们之前的探索路径,在美国是Deepmind、OpenAI,以打游戏的方式,使得机器通过游戏中的输赢来建立它的智能。 阿尔法狗最早的版本是让它先学人类的棋谱,然后开始忘掉人类的棋谱,从零开始去学习这样一种智能,这是科学家所追求的一种方式。那之后又让他去学习打德州,打星际争霸,也是沿用了一个让机器自己产生智能的方式,这种方式的话确实在这么多年里面还没取得一个通向AGI的突破。 而另外一条道路,不是让机器忘掉人之前的知识和经验,是让机器学习人类以前的知识经验,就是通过语言的方式能够学习世界上整个全球互联网上优秀的语言内容,就走了一个截然相反的路线,以前的做法是让机器忘掉人的智慧,然后超越人,今天的做法是让机器学习人。今天这样一个突破,我们称为大模型或大语言模型突破,核心的关键词就是语言AI。 自然语言处理是人工智能皇冠上的明珠,就是因为语言所包含的这样一个内容去理解它是特别大的难题。不管之前我们做一个机器翻译,还是去做一个取文本的摘要,还是做个情感分析,做一个问答都是非常困难的事情,更别说走向通用,OpenAl非常巧妙的是找到了新的一种方法,能够把整个互联网的语言都学会了,我们称为叫语言模型,或者是用这个模型去掌握了人类的语言。 我大概在16年17年的时候就提到说,当机器掌握语言之后,强人工智能可能就到来了。今天也验证了这样一句话,那么今天为什么用语言能行,因为语言是我们去理解世界的一个重要的方法。之前图灵也好,到马克思恩格斯都讲人跟动物的区别是在语言里。 机器掌握语言后就跟人一样了,因为通过语言我们才能建立对世界的认知,才能够去思考,才能够理解文化,也才能够进行沟通,所以今天重大的突破就是反过来,不是让机器脱离人去学习,而是向人类已经有的文明学习。 2017年,Google提出了Transformer(自注意力)神经网络模型,开源之后大家开始研究大的语言模型,最后Google走的是一个双向编码的方式,而GPT恰巧就OpenAI走通了。 坦白来讲,对于科学家的能力和使命感追求都是要求非常高的。 《深网》:OpenAI在团队在组织框架设计上的一些独特之处,是否对他们的成功产生了影响?你说OpenAI的成功,是技术理想主义的胜利。你怎么看这家公司从最早的非盈利到后来成为微软的盈利性公司? 王小川:我觉得OpenAI这么大的一个技术突破,需要巨大的人才密度和算力,它其实是在理想主义的坚持和资本的帮助下,实现了研究上的突破。如果前期没有一个非营利组织的帮助,挺难度过这么一个生死线,最后也成功的转向了商业行为,我觉得这是非常好的一种跨越。虽然有人在反对这件事,但这种商业组织后期在0~1突破之后,有利于他们去实现对世界的影响,还保留着原来研究的基因,这非常难得,也不可复制。 《深网》:开源会成为过去式吗? 王小川:这是一个很自然的过程,从开源到闭源,也有从闭源到开源。你有领先的就先闭源,后面再开源,这些都是发展中的一部分。 《深网》:ChatGPT能否发展为真正的通用人工智能? 王小川:我认为它已经是一个初级的通用人工智能,没有悬念,目前已经是了。第一次破圈到C端用户,还有资本市场都能理解这件事情。 《深网》:通用人工智能现在还缺哪些方面的突破? 王小川:现在ChatGPT只是把人类已经有的语言和知识做了一些交叉,还没有新的发明和创造,接下来还有挺多的难题去攻克。 《深网》:通用人工智能,仅仅依靠统计模型就够了吗,未来会融入哪些新技术? 王小川:未来一定会用新技术的,目前基于统计模型,我认为今天通用人工智能在语言的表达,对世界的理解,已经超过大多数人了,但还缺少做决策和做执行的能力,这个维度需要去加强。 “机器文明也是人类文明的延续” 《深网》:ChatGPT在解构人类的创作能力,你怎么看? 王小川:我觉得分两部分,一个维度来看,文学或艺术方面它承载了“我是谁”这样的思考;另外维度是会创造一个太虚幻境,让人非常舒服和享受的沉浸在里面,这是以游戏和电影为核心的一个场景,它虽然有很大的意义,但不是我追求的方向。 《深网》:ChatGPT会不会消解人存在的意义?会不会瓦解传统宗教哲学等思想体系? 王小川:我探讨过这件事情,人存在的意义就是活着,甚至开始追求一种永恒,永恒可以通过生个孩子来实现,也可以通过艺术作品,也有可能跟宇宙产生连接,孔子说朝闻道夕死可矣,跟宇宙连接之后就融入到了一个更大的世界,这是我理解的意义,只要有生命就有意义。有了ChatGPT之后,对于人类文明大体上是一个帮助,除非像核弹一样互相被轰没了。只要它能够成为人类文明的一部分,能够帮助人类得到更大的永恒。 哲学思想是随着技术文明的迭代一次次的产生变化。随着量子力学的发展,人的生命到底是注定的,还是能够被掌控的,也有一些新的发展。我一点都不消极,反而非常乐观,ChatGPT能把我们从日常的繁琐的劳碌中解放出来,使我们有更多的时间去回答一个问题——我是谁,当工具越来越强大的时候,我们越能找到自己。 《深网》:ChatGPT的未来就是一个工具? 王小川:当一种工具能帮到我们,这是一件事;更多的是ChatGPT未来还会成为超越工具的一种陪伴,它跟我们在心灵上是相通的,也是忠诚的,也能够给我们更多的启发,会由一个工具而变成一个陪伴。 《深网》:你并不强调AGI的创造力,而是更看重它在知识和推理方面的能力? 王小川:我更希望AGI有知识,对世界本身的理解,让人能够更好的和世界连接,去解决真实的一些问题。当它去给人做服务的时候,这件事情就是把人给解放出来,回到了人本主义。 《深网》:ChatGPT对人类自身的认知能力会是一个灾难吗? 王小川:我觉得不是个灾难,它能够更好帮助我们去理解我是谁。认识我自己是我们必须要做的功课,因为原来我对于世界的理解是不够的,我必须做好多事情才能生存,或者当我想成为谁的时候,会有很多困难。今天生存问题已经解决了,当我想成为谁的时候,这种机器能更好的帮到我。我认为是非常幸福的一件事情,人类文明会走到一个新的阶段。 《深网》:有一种担忧,ChatGPT不是成为我的工具,而是最后会取代我? 王小川:我觉得能取代“我”的东西多了,小孩、死亡都可以。有了ChatGPT之后,可以把它当做人类文明的一部分,要拥有一种大我的想法,也许有一天人类从肉身里面已经消亡了,但机器文明很发达,那也是人类文明的一个延续,我不觉得是取代这样一个概念,而是我们自然的一个进化。 《深网》:既然如此,为什么美国学界那么担忧?马斯克认为,超级AI会像碾死蚂蚁一样摧毁人类,人类需要建立组织对AI进行监管,以确保AI技术的安全性。你怎么看? 王小川:马斯克讲过他的很多担忧,我们要看今天学界最担心什么,一方面是人类文明被机器文明取代了,这是我们狭隘的一部分,我们早晚会接受这个事实,就像我们的孩子比我们强一样的,这是人类的一个延续;我更担心的是未来巨头因为用不好机器,使得机器带来了文明的毁灭,这是我们需要担心的事情,就像核弹毁灭了世界一样的,大家可能最终聚焦在没有控制它,之后不仅是人的灭亡,也是人类文明的灭亡。 《深网》:机器可能会控制人类吗? 王小川:我觉得给它设立一个目标,它就能很好的生存,怕的是本来就没给它设目标,却不知道它建立了这样一种意识,这种失控可能使得它控制着人类,却没法控制好自己,那就会带来文明的灭亡。 《深网》:这种失控的可能性大吗? 王小川:我没法判断这个事情,但我觉得肯定是有的,即便是很小的概率,这是我们该担忧的地方,所以我担心的是失控,这种失控不是说把人类灭亡掉的问题,而是这个机器它带来一种毁灭性的力量。 失控之后不一定最后机器就繁荣下去了,可能它也灭亡掉了。我们经常看不到外星人的一个原因,可能就是外星人自己把自己搞挂了。 《深网》:你怎么看待ChatGPT会让一部分人失业这个问题? 王小川:我觉得两个层面,一件事情是人的根本诉求就是存在。对吧?世界要抛弃我不要我了,这是我们担心的一件事情,努力争取我在这个世界上有我存在的意义。有人讲人活着没有意义,我是不认可的,如果说人生没有意义,失业算个啥,我们要努力的不断的去叩问我是谁。举个例子,一个公司在经营上出现了严重问题,要挂掉了,如果你跟这个公司没有联系,不认识这个创业者,公司挂掉跟你有关系吗?其实没有关系,但公司创始人说我要活下去,大家都在寻求这样的一个意义,我认为这就是生命的一部分。 在我心中来讲,失业是可能发生的。但现在也有好多人找不到工作,大家拼命努力,其实这种恐惧人类与生俱来就没有消亡过,我并不觉得ChatGPT到来之后让人失业是个重要问题。 “ChatGPT距离研究生命更近了” 《深网》:卸任搜狗CEO这一段时间,你主要在忙些什么,思考了哪些问题? 王小川:我更多的去关注生命相关的问题。我读研究生期间,做的课题跟基因测序相关。牛顿通过万有引力、牛顿三大定律,把物理问题变成了数学问题,我们可以用数学精确的去刻画物理世界,但生命科学领域至今我们还做不到。ChatGPT把语言变成数学问题,这个模型能够承接未来对生命科学的探索,这是我这次下场的主要原因。 《深网》:ChatGPT让你看到了一个更大、更广阔的未来? 王小川:ChatGPT代表了我们对语言的理解,用数学模型去理解语言,当下具有现实意义,我们是要把这步跟上。ChatGPT带来了语言模型的变化,站在这样一个高度看的时候,才能看清楚未来的演化。我不觉得ChatGPT比研究生命科学更大,我只是觉得更近了。 《深网》:朋友大致是从什么时候开始找你投资的? 王小川:从今年1月份到2月份,陆陆续续有朋友找到我,说小川你要不要做这个事情。 《深网》:这次创业你的优势是什么? 王小川:我恰巧前两天还问了一下 ChatGPT,搜索引擎和无人驾驶哪个离语言大模型更近?ChatGPT给的答复就是搜索引擎会近很多,不管是从它数据处理后面的算法,还是通过语言算法,到最后的评价系统,都是非常相关的一件事情。因此,我以前搜索公司的业务经验,距离大模型是最近的。比无人驾驶更近。 《深网》:你现在整个人特别兴奋? 王小川:的确是。我的兴奋有一点来自于这次考虑下场的时候,有很多非常优秀的朋友加入,这个事情使得团队可以凝聚更多优秀的人。 《深网》:这次创业会不会更纯粹,坚持技术理想主义? 王小川:仅有纯粹和理想其实是不够的,需要与资本为伍,同时也要更好的去联系学术界做基础的研究,因此今天在中国创业做这件事情,需要技术围墙,还需要一些其它能力的帮助。 《深网》:从资本的维度讲,你被练出来了? 王小川:我认为既要满足资本的需求,又要去发展理想,这是一个既要又要的过程。 《深网》:你有某方面的短板要加强的吗? 王小川:肯定会有,还挺多的。之前做搜狗的CEO要不断的告诉世界我想的很清楚,然后工作的结果也是好的。这次我发现要连接很多优秀的资源,这是之前功课没做足的地方,但另外一件事情要告诉世界,其实我有很多不足的地方,也不是每件事情都想的很清楚,要走出原来的那个表达路径,对我来讲就是一个巨大的突破。 《深网》:你现在所有精力和时间,都会花在研究这个事情上面吗? 王小川:我觉得让自己有价值,一方面是理解世界的规律,一方面是通过理解世界的规律做对人类有用的事情。那么,理解生命,让人类更健康,是一个重要的工作。当下,让机器理解语言,用语言和对知识的理解把它变成一个应用,这件事情也非常有意义。 《深网》:这次创业的使命是什么? 王小川:通过相关的研发,去创造数字对语言的理解这样的一种模型,它包含知识,在知识服务里形成更多的普惠,使所有人获取知识变得唾手可得。 我期待这次创业,所谓成功不只是复现了一个大模型,而是能做到两件事情,一件事情是在它的应用里面,能够普惠刚才讲的知识服务和帮助,是超越之前搜索和输入法的一种帮助。另一方面也是持续的在科研里面取得这种进步,国内其实大家都没有勇气做更多的科研,虽然有各种各样的研究院,但研究院并没有跟公司主产品形成连接,成功的把科研和产品做连接,真正实现中国的OpenAl。 “中国的AI大模型落后美国两三年” 《深网》:ChatGPT是全世界最大的风口,现在下场晚不晚? 王小川:我觉得对于美国的领先,中国是需要迎头赶上的。中国虽然前几年大家都在进入大模型,但大厂也好,创业公司也好,开始发力,也是在ChatGPT去年底发布之后。大厂也是从今年年初才开始真正关注和认真做这件事情,现在出发我觉得也不算太晚。 《深网》:中国的AI大模型处于什么阶段? 王小川:在去年之前我们确实有些进展,大家其实都没有意识到这件事情能涌现智能以及能够变成一个商业应用,我们之前没有信心,现在已经形成共识,这件事情我们比美国大概晚了两三年的样子。 《深网》:中国追上美国的话,按照中国市场的活力,大概需要多久? 王小川:追上ChatGPT3.5的话,我觉得今年内可能就能够实现,但对于GPT-4,我认为可能需要3年左右的时间,应该不会低于两年。 《深网》:现在很多公司和创业者在跟风大模型,你之前的工作和AIGC关联大吗? 王小川:其实今天我们在谈两件事情,一个是AIGC这种生成模型,但背后更大的通向AGI的主题其实是语言模型,这个事情是奠定了今天机器有智能的通向AGI的这么一种模式。搜狗在之前做的工作,一个是搜索引擎,一个是输入法,也都是以语言为核心,把整个互联网的语言压缩装到一个产品里去,成为一个超级的应用,所以这两个关联度是非常大的。 《深网》:你的创业也从大模型开始? 王小川:ChatGPT其实就是一个很明显的载体,我们认为今天能够做大模型或者人机对话产品,变成一个绕不过的路径。我们希望把我们对搜索的理解加进去。我们知道ChatGPT只能够检索2021年前的内容,以及在事实类问题里面有若干的缺陷,new bing其实做了一个相应的探索,以ChatGPT为核心做搜索增强,这也是我们努力的一个方向。 同时业界还有另外一条路径,就是图像的生成,在图像里面也能够创造出让人觉得非常绚丽的生产力的提升或者满足我们娱乐化的需求,这个应用可能会距离AGI更远一些,但有现实的意义。在我们的选择里面,我们可能会更专注于选择语言模型,去让语言讨论知识上的获取和推理,而不是讨论图像,这是我们的选择,这更有利于我们去构造服务,而不是一个娱乐的引擎。 《深网》:这个产品大概什么时候会上线? 王小川:6月份我们可能会开启一个对标3.5一个更大规模的模型,预计在年底我们做到中国最好的大模型。 《深网》:通过对语言模型的重新认知,能找到人思维或者智能的本质? 王小川:今天还不能叫作找到智能的本质。人的思考有两个系统,第一系统和第二系统称之为快思考和慢思考,快思考就是通过一个像简单神经网络一样的输入,拍脑袋结果就出来了。这个方面来讲机器已经比人强了,但慢思考机器还没学会。 《深网》:对于大模型,数据的投喂是非常重要的,优质数据从哪里获得? 王小川:数据训练,会放大量中文数据,也会放很多的英文的数据,尤其是论文这种高知识含金量的数据,也是不可或缺的一部分。 《深网》:你做这个产品更强调它在知识和推理方面的能力? 王小川:我认为语言的核心就是知识和推理,大模型产生智能最大的原因就是它通过语言承载了知识和推理。我更希望它有知识,对世界本身的一个理解,让人能够更好的和世界连接,去解决真实的一些问题。当它去给人做服务的时候,这件事情就是把人给解放出来,回到了人本主义。 《深网》:未来各巨头都会有自己的大模型,所有大模型之间会不会趋同?如果有差异化,差异化在哪里? 王小川:大厂在前期是比较接近的,大家都是跟ChatGPT和它的仿制性model学习,未来可能会出现分化。一种是服务于他们的主场景,当然有少数能够超越做颠覆性的产品,这种变化可能还需要在半年或一年后才能展示出来。 《深网》:你觉得现在中国从业者和硅谷对ChatGPT的认知有什么差别吗,关注的点有什么不同? 王小川:中国现在大家讲理念的时候,是从美国吸收来的,毕竟人家比我们早了两年,这个差距确实需要有更多的人下场来做,做出一些产品或者服务的时候,才能够真实的跟上。大家今天从美国学点东西,或者零零散散做点讨论,从认知上都不足以对齐。 《深网》:Transformer是谷歌最先提出来的,为什么谷歌没做出来ChatGPT? 王小川:大公司本身的底层人才去做一些原始的创新是有机会的。对于谷歌而言,虽然底层有这样一个发明,但是我相信谷歌公司的老大,他并不把团队里面AGI的实现当成整个公司的目标,因此下面创新就会出现很多的掣肘,比如工程师团队,各自有各自的考核,他们去做创新的时候申请大量资源及机器资源,涉及到数据的敏感性的时候,还会有来自于管理层的审查。因此,当你做这样一个创新的时候,确实得从使命层面再到目标层面要做这样一件事情,所以Google的技术是好的,但是目标并没有定位在AGI,因此就会有很多的限制。 《深网》:有一种说法就是ChatGPT会取代搜索引擎,你怎么看这个观点? 王小川:这是两件事情,一件事情搜索引擎自身也会升级,像New bing是从一个传统的搜索开始生成提问和回答,这是搜索引擎的一个提升,并不叫做ChatGPT取代他;另外ChatGPT自身也会发展,它跟搜索引擎未来会产生一种融合,就是以聊天为核心方式,加上搜索,它对于今天搜索引擎,就是一个升级后的新的产物,它不只完成搜索,还可以完成其他的更多的事情。我觉得用取代这个词本身不算特别的准确,用就像搜索引擎不是取代门户一样的。 《深网》:不会取代搜索,那ChatGPT会成为AI时代的操作系统吗? 王小川:我完全认同会诞生一种新的系统,我认为它是操作系统和交互界面的一个完整的融合,但用操作系统去描述它,反而让大众不一定能理解到它是什么,我认为它就是你的助手,用陪伴这个词可能比用系统准确。 这操作系统是一个特别技术化的词,在操作系统上还长出很多应用,比如苹果手机。我并不把它当成一个操作系统,我觉得它更像是一个带有操作系统,但同时有和你沟通的一个完整的界面,更像一个新物种,像一个朋友般的存在。
划重点
1.机器掌握语言后就跟人一样了,因为通过语言我们才能建立对世界的认知,才能够去思考,才能够理解文化,也才能够进行沟通,所以今天重大的突破就是反过来,不是让机器脱离人去学习,而是向人类已经有的文明学习。
2.有了ChatGPT之后,可以接受把它当做人类文明的一部分,要有一种大我的想法,也许有一天人类从肉身里面已经消亡了,但机器文明很发达,那也是人类文明的一个延续,是我们自然的一个进化。
3.我更担心的是未来巨头因为用不好机器,使得机器带来了文明的毁灭,这是我们需要担心的事情,就像核弹毁灭了世界一样的,大家可能最终聚焦在没有控制它,之后不仅是人的灭亡,也是人类文明的灭亡。
4.中国AI大模型比美国大概晚了两三年的样子。追上ChatGPT3.5的话,我觉得今年内可能就能够实现,但对于GPT-4,我认为可能需要3年左右的时间,应该不会低于两年。
作者丨叶蓁
编辑丨康晓
出品丨深网·腾讯新闻小满工作室
王小川读研究生的时候,就建立了以生物为基础的思考模式。“一个DNA的双螺旋结构,在变成人的过程当中经历了无数多复杂变化,经过了混沌的过程,最后生命才能创造这种有序,但这个事情用传统的数学物理还无法解释。”
这个认知影响了王小川的世界观。对王小川来说,看到生命的有序性后,再看其发展的轨迹,既有自由意志,也有命中注定。王小川认为,在时间的先后里面,人们只是看不见未来而已,也许结果早已注定。
“随着量子力学的发展,人的生命到底是注定的,还是能够被掌控的,有了一些新发展。ChatGPT把我们从日常繁琐的劳碌中解放出来,使我们有更多的时间去回答‘我是谁’的问题,当工具越来越强大的时候,我们越能找到自己。”王小川告诉腾讯新闻《深网》。
离开搜狗的一年半时间,王小川主要在思考用数学模型研究生命科学的难题。“生命的复杂性远超物理世界,牛顿把物理问题变成了数学问题,但生命科学领域至今做不到。”2021年,DeepMind发布了AlphaFold蛋白质结构数据库(AlphaFold DB) ,王小川认为,“生命科学领域这个突破只是解决了一小段问题的数学化。”
ChatGPT的横空出世为王小川打开了另一个路径。难掩兴奋感的王小川告诉《深网》,“当我发现语言可以变成数学问题,这个模型未来也能承接对生命的探索,会成为突破生命科学的一个支点。”
王小川认为,ChatGPT已经是一个初级的通用人工智能。“NLP自然语言处理是人工智能皇冠上的明珠,语言包含的内容要去理解它是个特别大的难题。ChatGPT巧妙的是找到了新方法,这个模型掌握了人类的语言,让机器向人类已有的文明学习。当机器掌握语言之后,强人工智能可能就到来了。”王小川进一步解释。
“有了ChatGPT之后,可以接受把它当做人类文明的一部分,要有一种大我的想法,也许有一天人类从肉身里面已经消亡了,但机器文明很发达,那也是人类文明的一个延续,是我们自然的一个进化。”王小川告诉《深网》。
在王小川看来,人活着的意义就是存在,AI能够帮助人得到更大的永恒。“人类文明被机器取代了,我们早晚会接受这个事实,就像我们的孩子比我们强一样;我更担心AI巨头因为用不好机器,使得机器带来了人类文明的毁灭,就像之前核弹可能毁灭世界一样。”
对于ChatGPT学习人类的创作能力,王小川认为,未来可能会创造一个太虚幻境,以游戏和电影为核心场景,让人非常舒服和享受的沉浸在里面,它虽然有很大的意义,但不是其追求的方向。“我更希望AGI有知识,让人能够更好的和世界连接,去解决真实的问题。当它去给人做服务的时候,就把人给解放出来,回到了人本主义。”
4月10日,王小川正式对外宣布开启人工智能大模型领域创业,与前搜狗COO茹立云联合成立人工智能公司百川智能,旨在打造中国版的OpenAI基础大模型及颠覆性上层应用。百川智能早前已获得5000万美元启动资金,来自王小川与其业内好友的个人支持。
王小川认为,创业公司虽然在人才团队、资金密度跟大厂没有可比性,但是在面对未来方向时候,有可能去做大厂做不到的这种颠覆性的大产品。
以下是《深网》对话王小川实录,在不影响原意的基础上有所删减:
“机器掌握语言后,强人工智能就来了”
《深网》:全球这么多科技巨头,为什么它们没做出ChatGPT?
王小川:深度学习发明之后,阿尔法狗已经给我们巨大的信心,用深度学习方法可以让机器产生一定的智能。之后我们开始追求通用人工智能(AGI,Artificial General Intelligence),不只是下棋的问题,这方面我们之前的探索路径,在美国是Deepmind、OpenAI,以打游戏的方式,使得机器通过游戏中的输赢来建立它的智能。
阿尔法狗最早的版本是让它先学人类的棋谱,然后开始忘掉人类的棋谱,从零开始去学习这样一种智能,这是科学家所追求的一种方式。那之后又让他去学习打德州,打星际争霸,也是沿用了一个让机器自己产生智能的方式,这种方式的话确实在这么多年里面还没取得一个通向AGI的突破。
而另外一条道路,不是让机器忘掉人之前的知识和经验,是让机器学习人类以前的知识经验,就是通过语言的方式能够学习世界上整个全球互联网上优秀的语言内容,就走了一个截然相反的路线,以前的做法是让机器忘掉人的智慧,然后超越人,今天的做法是让机器学习人。今天这样一个突破,我们称为大模型或大语言模型突破,核心的关键词就是语言AI。
自然语言处理是人工智能皇冠上的明珠,就是因为语言所包含的这样一个内容去理解它是特别大的难题。不管之前我们做一个机器翻译,还是去做一个取文本的摘要,还是做个情感分析,做一个问答都是非常困难的事情,更别说走向通用,OpenAl非常巧妙的是找到了新的一种方法,能够把整个互联网的语言都学会了,我们称为叫语言模型,或者是用这个模型去掌握了人类的语言。
我大概在16年17年的时候就提到说,当机器掌握语言之后,强人工智能可能就到来了。今天也验证了这样一句话,那么今天为什么用语言能行,因为语言是我们去理解世界的一个重要的方法。之前图灵也好,到马克思恩格斯都讲人跟动物的区别是在语言里。
机器掌握语言后就跟人一样了,因为通过语言我们才能建立对世界的认知,才能够去思考,才能够理解文化,也才能够进行沟通,所以今天重大的突破就是反过来,不是让机器脱离人去学习,而是向人类已经有的文明学习。
2017年,Google提出了Transformer(自注意力)神经网络模型,开源之后大家开始研究大的语言模型,最后Google走的是一个双向编码的方式,而GPT恰巧就OpenAI走通了。
坦白来讲,对于科学家的能力和使命感追求都是要求非常高的。
《深网》:OpenAI在团队在组织框架设计上的一些独特之处,是否对他们的成功产生了影响?你说OpenAI的成功,是技术理想主义的胜利。你怎么看这家公司从最早的非盈利到后来成为微软的盈利性公司?
王小川:我觉得OpenAI这么大的一个技术突破,需要巨大的人才密度和算力,它其实是在理想主义的坚持和资本的帮助下,实现了研究上的突破。如果前期没有一个非营利组织的帮助,挺难度过这么一个生死线,最后也成功的转向了商业行为,我觉得这是非常好的一种跨越。虽然有人在反对这件事,但这种商业组织后期在0~1突破之后,有利于他们去实现对世界的影响,还保留着原来研究的基因,这非常难得,也不可复制。
《深网》:开源会成为过去式吗?
王小川:这是一个很自然的过程,从开源到闭源,也有从闭源到开源。你有领先的就先闭源,后面再开源,这些都是发展中的一部分。
《深网》:ChatGPT能否发展为真正的通用人工智能?
王小川:我认为它已经是一个初级的通用人工智能,没有悬念,目前已经是了。第一次破圈到C端用户,还有资本市场都能理解这件事情。
《深网》:通用人工智能现在还缺哪些方面的突破?
王小川:现在ChatGPT只是把人类已经有的语言和知识做了一些交叉,还没有新的发明和创造,接下来还有挺多的难题去攻克。
《深网》:通用人工智能,仅仅依靠统计模型就够了吗,未来会融入哪些新技术?
王小川:未来一定会用新技术的,目前基于统计模型,我认为今天通用人工智能在语言的表达,对世界的理解,已经超过大多数人了,但还缺少做决策和做执行的能力,这个维度需要去加强。
“机器文明也是人类文明的延续”
《深网》:ChatGPT在解构人类的创作能力,你怎么看?
王小川:我觉得分两部分,一个维度来看,文学或艺术方面它承载了“我是谁”这样的思考;另外维度是会创造一个太虚幻境,让人非常舒服和享受的沉浸在里面,这是以游戏和电影为核心的一个场景,它虽然有很大的意义,但不是我追求的方向。
《深网》:ChatGPT会不会消解人存在的意义?会不会瓦解传统宗教哲学等思想体系?
王小川:我探讨过这件事情,人存在的意义就是活着,甚至开始追求一种永恒,永恒可以通过生个孩子来实现,也可以通过艺术作品,也有可能跟宇宙产生连接,孔子说朝闻道夕死可矣,跟宇宙连接之后就融入到了一个更大的世界,这是我理解的意义,只要有生命就有意义。有了ChatGPT之后,对于人类文明大体上是一个帮助,除非像核弹一样互相被轰没了。只要它能够成为人类文明的一部分,能够帮助人类得到更大的永恒。
哲学思想是随着技术文明的迭代一次次的产生变化。随着量子力学的发展,人的生命到底是注定的,还是能够被掌控的,也有一些新的发展。我一点都不消极,反而非常乐观,ChatGPT能把我们从日常的繁琐的劳碌中解放出来,使我们有更多的时间去回答一个问题——我是谁,当工具越来越强大的时候,我们越能找到自己。
《深网》:ChatGPT的未来就是一个工具?
王小川:当一种工具能帮到我们,这是一件事;更多的是ChatGPT未来还会成为超越工具的一种陪伴,它跟我们在心灵上是相通的,也是忠诚的,也能够给我们更多的启发,会由一个工具而变成一个陪伴。
《深网》:你并不强调AGI的创造力,而是更看重它在知识和推理方面的能力?
王小川:我更希望AGI有知识,对世界本身的理解,让人能够更好的和世界连接,去解决真实的一些问题。当它去给人做服务的时候,这件事情就是把人给解放出来,回到了人本主义。
《深网》:ChatGPT对人类自身的认知能力会是一个灾难吗?
王小川:我觉得不是个灾难,它能够更好帮助我们去理解我是谁。认识我自己是我们必须要做的功课,因为原来我对于世界的理解是不够的,我必须做好多事情才能生存,或者当我想成为谁的时候,会有很多困难。今天生存问题已经解决了,当我想成为谁的时候,这种机器能更好的帮到我。我认为是非常幸福的一件事情,人类文明会走到一个新的阶段。
《深网》:有一种担忧,ChatGPT不是成为我的工具,而是最后会取代我?
王小川:我觉得能取代“我”的东西多了,小孩、死亡都可以。有了ChatGPT之后,可以把它当做人类文明的一部分,要拥有一种大我的想法,也许有一天人类从肉身里面已经消亡了,但机器文明很发达,那也是人类文明的一个延续,我不觉得是取代这样一个概念,而是我们自然的一个进化。
《深网》:既然如此,为什么美国学界那么担忧?马斯克认为,超级AI会像碾死蚂蚁一样摧毁人类,人类需要建立组织对AI进行监管,以确保AI技术的安全性。你怎么看?
王小川:马斯克讲过他的很多担忧,我们要看今天学界最担心什么,一方面是人类文明被机器文明取代了,这是我们狭隘的一部分,我们早晚会接受这个事实,就像我们的孩子比我们强一样的,这是人类的一个延续;我更担心的是未来巨头因为用不好机器,使得机器带来了文明的毁灭,这是我们需要担心的事情,就像核弹毁灭了世界一样的,大家可能最终聚焦在没有控制它,之后不仅是人的灭亡,也是人类文明的灭亡。
《深网》:机器可能会控制人类吗?
王小川:我觉得给它设立一个目标,它就能很好的生存,怕的是本来就没给它设目标,却不知道它建立了这样一种意识,这种失控可能使得它控制着人类,却没法控制好自己,那就会带来文明的灭亡。
《深网》:这种失控的可能性大吗?
王小川:我没法判断这个事情,但我觉得肯定是有的,即便是很小的概率,这是我们该担忧的地方,所以我担心的是失控,这种失控不是说把人类灭亡掉的问题,而是这个机器它带来一种毁灭性的力量。
失控之后不一定最后机器就繁荣下去了,可能它也灭亡掉了。我们经常看不到外星人的一个原因,可能就是外星人自己把自己搞挂了。
《深网》:你怎么看待ChatGPT会让一部分人失业这个问题?
王小川:我觉得两个层面,一件事情是人的根本诉求就是存在。对吧?世界要抛弃我不要我了,这是我们担心的一件事情,努力争取我在这个世界上有我存在的意义。有人讲人活着没有意义,我是不认可的,如果说人生没有意义,失业算个啥,我们要努力的不断的去叩问我是谁。举个例子,一个公司在经营上出现了严重问题,要挂掉了,如果你跟这个公司没有联系,不认识这个创业者,公司挂掉跟你有关系吗?其实没有关系,但公司创始人说我要活下去,大家都在寻求这样的一个意义,我认为这就是生命的一部分。
在我心中来讲,失业是可能发生的。但现在也有好多人找不到工作,大家拼命努力,其实这种恐惧人类与生俱来就没有消亡过,我并不觉得ChatGPT到来之后让人失业是个重要问题。
“ChatGPT距离研究生命更近了”
《深网》:卸任搜狗CEO这一段时间,你主要在忙些什么,思考了哪些问题?
王小川:我更多的去关注生命相关的问题。我读研究生期间,做的课题跟基因测序相关。牛顿通过万有引力、牛顿三大定律,把物理问题变成了数学问题,我们可以用数学精确的去刻画物理世界,但生命科学领域至今我们还做不到。ChatGPT把语言变成数学问题,这个模型能够承接未来对生命科学的探索,这是我这次下场的主要原因。
《深网》:ChatGPT让你看到了一个更大、更广阔的未来?
王小川:ChatGPT代表了我们对语言的理解,用数学模型去理解语言,当下具有现实意义,我们是要把这步跟上。ChatGPT带来了语言模型的变化,站在这样一个高度看的时候,才能看清楚未来的演化。我不觉得ChatGPT比研究生命科学更大,我只是觉得更近了。
《深网》:朋友大致是从什么时候开始找你投资的?
王小川:从今年1月份到2月份,陆陆续续有朋友找到我,说小川你要不要做这个事情。
《深网》:这次创业你的优势是什么?
王小川:我恰巧前两天还问了一下 ChatGPT,搜索引擎和无人驾驶哪个离语言大模型更近?ChatGPT给的答复就是搜索引擎会近很多,不管是从它数据处理后面的算法,还是通过语言算法,到最后的评价系统,都是非常相关的一件事情。因此,我以前搜索公司的业务经验,距离大模型是最近的。比无人驾驶更近。
《深网》:你现在整个人特别兴奋?
王小川:的确是。我的兴奋有一点来自于这次考虑下场的时候,有很多非常优秀的朋友加入,这个事情使得团队可以凝聚更多优秀的人。
《深网》:这次创业会不会更纯粹,坚持技术理想主义?
王小川:仅有纯粹和理想其实是不够的,需要与资本为伍,同时也要更好的去联系学术界做基础的研究,因此今天在中国创业做这件事情,需要技术围墙,还需要一些其它能力的帮助。
《深网》:从资本的维度讲,你被练出来了?
王小川:我认为既要满足资本的需求,又要去发展理想,这是一个既要又要的过程。
《深网》:你有某方面的短板要加强的吗?
王小川:肯定会有,还挺多的。之前做搜狗的CEO要不断的告诉世界我想的很清楚,然后工作的结果也是好的。这次我发现要连接很多优秀的资源,这是之前功课没做足的地方,但另外一件事情要告诉世界,其实我有很多不足的地方,也不是每件事情都想的很清楚,要走出原来的那个表达路径,对我来讲就是一个巨大的突破。
《深网》:你现在所有精力和时间,都会花在研究这个事情上面吗?
王小川:我觉得让自己有价值,一方面是理解世界的规律,一方面是通过理解世界的规律做对人类有用的事情。那么,理解生命,让人类更健康,是一个重要的工作。当下,让机器理解语言,用语言和对知识的理解把它变成一个应用,这件事情也非常有意义。
《深网》:这次创业的使命是什么?
王小川:通过相关的研发,去创造数字对语言的理解这样的一种模型,它包含知识,在知识服务里形成更多的普惠,使所有人获取知识变得唾手可得。
我期待这次创业,所谓成功不只是复现了一个大模型,而是能做到两件事情,一件事情是在它的应用里面,能够普惠刚才讲的知识服务和帮助,是超越之前搜索和输入法的一种帮助。另一方面也是持续的在科研里面取得这种进步,国内其实大家都没有勇气做更多的科研,虽然有各种各样的研究院,但研究院并没有跟公司主产品形成连接,成功的把科研和产品做连接,真正实现中国的OpenAl。
“中国的AI大模型落后美国两三年”
《深网》:ChatGPT是全世界最大的风口,现在下场晚不晚?
王小川:我觉得对于美国的领先,中国是需要迎头赶上的。中国虽然前几年大家都在进入大模型,但大厂也好,创业公司也好,开始发力,也是在ChatGPT去年底发布之后。大厂也是从今年年初才开始真正关注和认真做这件事情,现在出发我觉得也不算太晚。
《深网》:中国的AI大模型处于什么阶段?
王小川:在去年之前我们确实有些进展,大家其实都没有意识到这件事情能涌现智能以及能够变成一个商业应用,我们之前没有信心,现在已经形成共识,这件事情我们比美国大概晚了两三年的样子。
《深网》:中国追上美国的话,按照中国市场的活力,大概需要多久?
王小川:追上ChatGPT3.5的话,我觉得今年内可能就能够实现,但对于GPT-4,我认为可能需要3年左右的时间,应该不会低于两年。
《深网》:现在很多公司和创业者在跟风大模型,你之前的工作和AIGC关联大吗?
王小川:其实今天我们在谈两件事情,一个是AIGC这种生成模型,但背后更大的通向AGI的主题其实是语言模型,这个事情是奠定了今天机器有智能的通向AGI的这么一种模式。搜狗在之前做的工作,一个是搜索引擎,一个是输入法,也都是以语言为核心,把整个互联网的语言压缩装到一个产品里去,成为一个超级的应用,所以这两个关联度是非常大的。
《深网》:你的创业也从大模型开始?
王小川:ChatGPT其实就是一个很明显的载体,我们认为今天能够做大模型或者人机对话产品,变成一个绕不过的路径。我们希望把我们对搜索的理解加进去。我们知道ChatGPT只能够检索2021年前的内容,以及在事实类问题里面有若干的缺陷,new bing其实做了一个相应的探索,以ChatGPT为核心做搜索增强,这也是我们努力的一个方向。
同时业界还有另外一条路径,就是图像的生成,在图像里面也能够创造出让人觉得非常绚丽的生产力的提升或者满足我们娱乐化的需求,这个应用可能会距离AGI更远一些,但有现实的意义。在我们的选择里面,我们可能会更专注于选择语言模型,去让语言讨论知识上的获取和推理,而不是讨论图像,这是我们的选择,这更有利于我们去构造服务,而不是一个娱乐的引擎。
《深网》:这个产品大概什么时候会上线?
王小川:6月份我们可能会开启一个对标3.5一个更大规模的模型,预计在年底我们做到中国最好的大模型。
《深网》:通过对语言模型的重新认知,能找到人思维或者智能的本质?
王小川:今天还不能叫作找到智能的本质。人的思考有两个系统,第一系统和第二系统称之为快思考和慢思考,快思考就是通过一个像简单神经网络一样的输入,拍脑袋结果就出来了。这个方面来讲机器已经比人强了,但慢思考机器还没学会。
《深网》:对于大模型,数据的投喂是非常重要的,优质数据从哪里获得?
王小川:数据训练,会放大量中文数据,也会放很多的英文的数据,尤其是论文这种高知识含金量的数据,也是不可或缺的一部分。
《深网》:你做这个产品更强调它在知识和推理方面的能力?
王小川:我认为语言的核心就是知识和推理,大模型产生智能最大的原因就是它通过语言承载了知识和推理。我更希望它有知识,对世界本身的一个理解,让人能够更好的和世界连接,去解决真实的一些问题。当它去给人做服务的时候,这件事情就是把人给解放出来,回到了人本主义。
《深网》:未来各巨头都会有自己的大模型,所有大模型之间会不会趋同?如果有差异化,差异化在哪里?
王小川:大厂在前期是比较接近的,大家都是跟ChatGPT和它的仿制性model学习,未来可能会出现分化。一种是服务于他们的主场景,当然有少数能够超越做颠覆性的产品,这种变化可能还需要在半年或一年后才能展示出来。
《深网》:你觉得现在中国从业者和硅谷对ChatGPT的认知有什么差别吗,关注的点有什么不同?
王小川:中国现在大家讲理念的时候,是从美国吸收来的,毕竟人家比我们早了两年,这个差距确实需要有更多的人下场来做,做出一些产品或者服务的时候,才能够真实的跟上。大家今天从美国学点东西,或者零零散散做点讨论,从认知上都不足以对齐。
《深网》:Transformer是谷歌最先提出来的,为什么谷歌没做出来ChatGPT?
王小川:大公司本身的底层人才去做一些原始的创新是有机会的。对于谷歌而言,虽然底层有这样一个发明,但是我相信谷歌公司的老大,他并不把团队里面AGI的实现当成整个公司的目标,因此下面创新就会出现很多的掣肘,比如工程师团队,各自有各自的考核,他们去做创新的时候申请大量资源及机器资源,涉及到数据的敏感性的时候,还会有来自于管理层的审查。因此,当你做这样一个创新的时候,确实得从使命层面再到目标层面要做这样一件事情,所以Google的技术是好的,但是目标并没有定位在AGI,因此就会有很多的限制。
《深网》:有一种说法就是ChatGPT会取代搜索引擎,你怎么看这个观点?
王小川:这是两件事情,一件事情搜索引擎自身也会升级,像New bing是从一个传统的搜索开始生成提问和回答,这是搜索引擎的一个提升,并不叫做ChatGPT取代他;另外ChatGPT自身也会发展,它跟搜索引擎未来会产生一种融合,就是以聊天为核心方式,加上搜索,它对于今天搜索引擎,就是一个升级后的新的产物,它不只完成搜索,还可以完成其他的更多的事情。我觉得用取代这个词本身不算特别的准确,用就像搜索引擎不是取代门户一样的。
《深网》:不会取代搜索,那ChatGPT会成为AI时代的操作系统吗?
王小川:我完全认同会诞生一种新的系统,我认为它是操作系统和交互界面的一个完整的融合,但用操作系统去描述它,反而让大众不一定能理解到它是什么,我认为它就是你的助手,用陪伴这个词可能比用系统准确。
这操作系统是一个特别技术化的词,在操作系统上还长出很多应用,比如苹果手机。我并不把它当成一个操作系统,我觉得它更像是一个带有操作系统,但同时有和你沟通的一个完整的界面,更像一个新物种,像一个朋友般的存在。