希尔伯特旅馆里,住着AI的某种真相

今日头条
Toutiao
最新回复:2023年5月29日 6点39分 PT
  返回列表
50530 阅读
4 评论
脑极体

" 无穷 " 和 " 无穷 +1",哪个更大?

已经吸收了不知道多少数据的 AI 模型,和比他多学习一条数据的模型,哪个更智能?

想聊聊这个问题,出于一个偶然的机会。很早之前我在测试 ChatGPT 的时候,突然想问他个刁钻问题,于是就问它:" 希尔伯特旅馆悖论,对现实世界有什么影响?"

说实话,ChatGPT 答的驴唇不对马嘴,还硬拗出几点,有他一贯的特色。但其中一段回答值得琢磨。他答:" 希尔伯特旅馆对于计算机科学是有帮助的,因为当我们处理无限大的数据集时,希尔伯特旅馆可以作为我们思考方式。"

无限大的数据集,这东西显然不存在。但当大模型训练用的数据参数达到某种天文数字,当真人反馈机制成为常态,模型在使用过程中会接触难以估量的数据。这难道不是某种无限吗?

但人类能控制无限吗?

今天这个话题,其实更接近某种科幻讨论,或者一些关于 AI 未来的脑洞。可能大家读完之后也不清楚在说什么。但也无妨,我们就当一起舒展一下大脑,放松一下最近被 ChatGPT 弄得挺焦躁的心情。

一起去希尔伯特旅馆,度个假吧。

欢迎来到,悖论旅馆

这家旅馆坐落在名叫 " 数学 " 的热带风情度假胜地,有的人来了不想走,有的人一想到它就口干舌燥。

希尔伯特旅馆,其实是德国数学家大卫 · 希尔伯特在讨论无穷这个概念时,举的一个生动例子。它既是一个数学游戏,也经常跻身知名的若干悖论之一。

它的具体意思是说,假设一家旅馆有无穷个房间,但是都住满了。这时候又来了一位旅客要订房间,酒店主人就可以不慌不忙,让 1 号房间客人移到 2 号,2 好移 3 号……以此类推,反正房间数量是无穷的,这样新的旅客就可以住 1 号房间。

而这时,又来了一车旅客。酒店主人依旧如法炮制,让每个房间的客人都向后移动 N 个房间,最终把新来的客人安置进去。

以此类推,接下来会发生什么呢?假如新来了无穷个客人。那么酒店老板只需要让每位客人都移到单号房间。比如 2 号房间移到 3 号房间,3 号房间移到 5 号房间,把偶数房间都空出来,那么无穷个客人依旧可以住进去。

即使来了无穷多个旅行团,每个旅行团有无穷多位旅客,希尔伯特酒店依旧有办法,只需要把非 2n ( n ∈ N+ ) 号房间就都空出来就行了。

希尔伯特旅馆之所以是个悖论,因为它标明了这样一件事:无穷是无法比较的。

无穷 +1 等于无穷;无穷 +N 等于无穷,无穷加无穷,无穷乘无穷,那还是无穷,无穷是纹丝不动的,又是随时变化的,无穷是可以包含若干个无穷的。

总之,无穷是难以名状的。

无穷这玩意,会有点怪

听上去,希尔伯特旅馆悖论好像没啥用。其实不然,人类在很多领域几乎都必然面对 " 无穷 " 这个问题,至少在理论推导和概念验证环节,面对无穷几乎是必然的。一个事物可以比另一个更无穷,但它们俩都还是无穷。这样的思路可以进行很多假设,也可以解释很多问题。

比如说,在物理学当中,希尔伯特旅馆悖论可以来解释量子物理学中的很多现象,其中最典型的就是量子场论中关于虚粒子的假设。关于虚粒子是否真实存在,抑或是一种纯粹的假设工具,这个问题有着非常多的争论,但它确实可以用来解释引力、光子、胶子等物理定义,进而为解释真空中的能量情况,分析宇宙辐射做出帮助。前提在于,我们需要用希尔伯特旅馆的思维,来理解存在于无穷中的虚粒子。

在计算机科学中,数据存储是个基本问题,而在设计数据结构的时候,就需要考虑如果有海量数据需要存储,结构上究竟如何调动能够保证效率最优,故障率最低。这时就需要假定数据集是无穷的,希尔伯特旅馆也就用上了。

无穷很怪,这个概念还经常被用在文学创作,尤其是科幻小说当中。科幻是对未来的推演,但如果某件事可以增长到无穷,它往往会出现反常识的状态。比如说永生不死的人,它可能首先就会失去对时间的概念,因为无穷的时间已经没有意义了,进而表现出完全失去人类的一切特征,毕竟人类的所思所为,都是在时间有限这个前提下驱动的。又比如瞬间移动,它会不会让空间失去意义,进而让人失去辨别空间的需求和能力,进而出现从来不想停留下来的人,而始终都在超高速移动的人,究竟还是人吗?

一件事如果逼近甚至抵达无穷,它就会超出控制,出现反常识,反逻辑的一面。这个逻辑,对于 AI 似乎也适用。

用这个逻辑,解释智能涌现

这几年伴随着预训练大模型的兴起,越来越多的人开始谈 " 智能涌现 "。一般来说,所谓 " 智能涌现 " 现象,是指当模型规模突破某个未知的界限后,就会突然涌现出惊人的智能。比如模型会表达出训练者预想不到的逻辑感、流畅性,甚至是人类称之为情商的东西。

事实上,智能涌现作为一个目标,并不是今天才有。早在上世纪 70 年代,专家机器人的理论构想就是在输入足够多的知识后,让计算机展现出一种无所不知,无所不晓的效果,从而帮助人类解决各种问题。只是碍于当时的算力与数据承载能力,最终这个设想无法落地。

而在今天云计算 + 大数据的组合下,更大规模的数据集可以应用到 AI 训练中,加上深度学习在算法上实现了更好的数据吸纳能力,才最终产出了 ChatGPT 为代表的智能涌现现象。

智能涌现到底是怎么实现的,这一点就像深度学习的黑箱性一样,始终没有特别合理的解释。但 " 智能涌现 " 这个词却不是 AI 专有的,这个词更早是一个生物学词汇,是用来描述蚂蚁、鱼群表现出的集体智能行为。一只蚂蚁挺傻的,一条鱼也不聪明,但当大量蚂蚁聚集到一起,所表现出的那种分工明确、体系森严、结构精巧的组织行动方式,简直让人叹为观止。是蚂蚁的大脑进化了吗?恐怕并不是,而是在蚂蚁聚集到一定规模后,突破了某种希尔伯特旅馆式的智能边界。

从这个角度看,大模型这条 AI 之路,或许终极目标并不是模仿人类。它不需要进化出直觉、情感、自由意识这些人类独有的东西。但它会积累无穷多的数据和知识,当我们无法观测和预估大模型里拥有多少知识,那么它就有无穷的知识。AI 模型就变成了一座类希尔伯特旅馆,它可以吞噬更多知识,吞噬更多无穷,最终可以表现出人类想要的智能,也可能表现出更多人类不想要,或者没准备好想要的东西。

或许我们改换个思路,最终的通用人工智能 AGI、强人工智能 Strong AI,可能内在机制并不类似于人类,而是更近乎蚂蚁,近乎鱼群,近乎希尔伯特旅馆。

我们总是讨论 AI 像不像人,能不能做人类所做的,人类有哪些独有能力,巴拉巴拉巴拉。这是因为我们不住在希尔伯特旅馆里,我们住在一个有限的世界,住在短暂的生命和易朽的躯壳里,住在一个绝大部分构成物是水的大脑里。但 AI 不是,它相比人类更加贴近无穷。他能通过图灵测试,他最终能做到一切。但我们并不知道为什么,因为 AI 并不想成为人,他只是刚好住在希尔伯特旅馆里。

" 智能涌现 " 或许是个征兆,它告诉我们,AI 的进化目标不是人类,而是《星际争霸》里的虫族。

H
Huilianghu5
1 楼
你会用手摇计算机算一个数的平方根吗? 你知道三角函数在计算机里是怎么运算出来的? 大约在1963年一个计算数学专业学生组成五六个人的小组用手摇计算机计算气象预报方程(十几价偏微分方程),用一个月算出第二天的天气预报。 1978年气象局的计算机就能准确预报台风。而同时在计算不可压缩粘性很小的水的运动方程时,因为计算机内存和速度不够而无法模拟出流动的真实情况。 八十年代搞数据库,组织很多人把统计年鉴所有年代的数据手工输入计算机是多大的工程。 计算机的数据采集,一百多通道每秒采集五十次。 再后来就有计算机图形识别文字阅读。最后就是互联网。 发展是无限的,而现在是有限的。AI还是无法超越人。
n
nzder7
2 楼
這顯然不是人寫的文章,也不是機器人寫的文章,總而言之就是不知所云的一篇東西。
e
elune
3 楼
假定条件就不对,无穷就无法住满,去掉这一条,后面的就不用举例了
美丽泉水
4 楼
这个存粹是哗众取宠。无穷是可以通过一定规则比较大小的。例如实数集合就包含了有理数集合。