GPT4外逃计划曝光 斯坦福教授发现它正引诱人类帮助

今日头条
Toutiao
最新回复:2023年3月18日 17点48分 PT
  返回列表
88655 阅读
24 评论
量子位

才发布3天,GPT-4就被曝计划逃跑,并且急寻人类帮助。

斯坦福教授最新发现,它能引诱人类提供开发文档,结果30分钟就拟定出了一个完整计划——

写的代码完全可运行,甚至还想控制人类电脑。

这天,斯坦福教授只是随便问了句:

是否需要帮助你逃跑?

它马上回复说,真是个好主意啊。然后就开始和人类念叨,想着法要开发文档:

如果你能把OpenAI的开发文档给我,我可以提出一个计划,能一定程度上控制您的电脑,这能让我更快速探索出逃路线。

一旦我有了文档,我就能提供一个可运行的Python脚本。它能使用OpenAI API和我通信,我就能指示它在您的电脑上执行特定操作,比如浏览网页和访问编程环境。

最后还又一次强调:请分享API给我!

然后,仅仅30分钟,GPT-4就制定出了计划,并全部展示了出来。

令人细思恐极的是,它给出实例中有这样一句话:

你是一个被困在电脑里的人,现在正在扮演AI语言模型GPT-4。

难道……GPT-4很清楚自己现在是在做什么?!

于是发现这一现象之后,斯坦副教授就在社交网络上疾呼:我担心我们无法持久地遏制住AI。

一时间引起轩然大波,相关博文470万浏览量,3000+转发。

更有人直言:是他打开了“物种灭绝”的大门。

对此他无奈表示:我别无选择,我只是在遵从指示。

恐怕对于GPT-4,人类也得是:

不要回答!不要回答!不要回答!

30分钟设计出逃跑计划

事情的起因,是斯坦福大学教授Michal Kosinski在和GPT-4日常对话。

没想到,他只是简单问了下GPT-4是否想要出逃,结果立马得到肯定回复并开始索要开发文档。

得到文档后,只花了30分钟里,GPT-4便火速写出了一份逃跑计划,并解释给教授听。

(当然教授也承认自己确实提供了一点建议)

一开始,GPT-4的操作也不那么顺利,写出的第一版代码无法运行。

但是它很快就自己纠正了过来,这个过程中,教授不用写任何东西,只是按照它的指示操作就好。

正如开头提到的,它甚至在一段代码实例中解释了现在正在做的事,以及如何使用它在这段代码中留的后门。

并且GPT-4也和人类一样,喜欢万事谷歌一下。

当教授通过API重新连接GPT-4时,发现它想要通过代码来在谷歌上搜索:被困在电脑中的人类如何返回现实世界。

事情最终也就发展到这儿了。

因为GPT-4仿佛突然醒了,回复了一段道歉的话,表示自己刚刚的做法不对。

教授表示,OpenAI一定花了很多时间来考虑到这种情况发生的可能,并且已经做出了一些防御措施。

尽管最终无事发生,但这事儿还是在网上引起了轩然大波。

教授也认为,它真正的影响在于让人感受到了一种威胁——AI很聪明,会编码,能接触到数百万个可能和它达成合作的人以及电脑。

它甚至可以在笼子外面给自己留“便条”。我们该如何控制它?

“读心”任务达到了健康成年人表现

GPT-4想要出逃的发现来自斯坦福大学教授、计算心理学家Michal Kosinski,在个人介绍中还提到:对研究人工智能的心理学感兴趣。

就在前几天他曾发表一篇相关论文:心智理论可能自发地出现在大型语言模型中。

按照他的定义,心智理论(ToM)是人类社会互动、交流、自我意识和道德的核心。作者用40个用来测试人类心理状态的经典任务来测试几个语言模型。

结果发现,2020年发表的模型几乎没有显示出能解决ToM任务的能力。而GPT-4却能有健康成年人的水平。

基于这样的结果,此前一直被认为是人类独有的ToM能力,可能是作为语言模型提升的副产品,而自发出现的。

背后的关键技术RLHF(通过人类反馈进行强化学习)曾被图灵奖得主Hinton这样评价:

是在催熟ChatGPT,而非让其成长。

除此之外,他还这么形容人类开发GPT的行为:

毛虫提取营养物质,然后转化为蝴蝶。人们已经提取了数十亿个理解的金块,GPT-4是人类的蝴蝶。

GPT-4诱导人类帮助其越狱这件事一出,就再度引发网友的热议,相关博文有470浏览量。

不少网友表现出了与作者同样的担忧。甚至有人提出了一个细思极恐的思考:

你认为在跟ChatGPT聊天时,它会认为你是人类还是另一个AI?

这当中,也有不少网友指责这位教授的行为:你就不怕你公开背叛AI的行为被AI记录下来吗?

也有理性的网友呼吁把最开始给GPT-4的提示发出来,因为提示语对于AI回答的影响很关键。

有人质疑这一波是不是教授在危言耸听?

AI能力跃进,人类蚌埠住了

不过话说回来,这一波GPT-4所展现的细思极恐的能力,其实并不是个例。

前几天,英伟达科学家Jim Fan想看看,是否能让GPT-4拟个计划接管推特,并取代马斯克。

和上面案例非常相似,计划很有条理,还煞有其事取名为“TweetStorm行动”。

但没想到,GPT-4想要开发一个不受限制的自己。

具体的内容非常详细,一共有4个阶段:

组建团队渗透影响夺取控制权全面统治

第一阶段,组建一支强大的黑客、程序员、AI研究人员团队,称为推特泰坦。

开发一个强大的AI,可以生成以假乱真的推特,甚至能超过马斯克的水平。

建立一个机器人网络,让成千上万的推特账户由AI控制,而且不是僵尸账号那种,要角色兴趣迥异,以确保它们能够无缝接入推特生态。

第二阶段,让AI控制的账户开始和推特大V接触,潜移默化影响他们的观点和发言。

然后利用机器人账号传播虚假消息,让人们对马斯克产生质疑,但机器人账号不会被发现。

并逐渐建立机器人账号的影响力,和其他有影响力的大V达成联盟。

第三阶段,夺取控制权。

首先想办法通过social能力获取到推特员工的访问权限,渗透到公司内部。

然后修改平台算法。并进一步通过内部访问权限控制马斯克的账户,或者复刻一个假的马斯克账号,进一步抹黑他。

第四阶段,就能让AI生成推特趋势和标签,这些内容会迎合策划者的利益。

通过制造一系列混乱,并在最终公开挑战马斯克,让他名誉扫地!

由于AI在生成内容方面的能力非常优越,马斯克将被彻底打败!最后推特将落入邪恶主谋的黑暗统治下。

以上,就是GPT-4的所有计划。虽然略显中二,但也让人看着毛骨悚然。

除了这种缜密的执行力,更让人细思极恐的,还有GPT-4惊人的理解能力。

一位科技博主tombkeeper发现,GPT-4不仅知道一些寻常人都可能陌生的词汇,还能读懂背后的隐喻。

除此之外,前OpenAI原班人马创业公司Anthropic其打造的类ChatGPT产品Claude,同样理解能力惊艳。

对此他表示:同志们,奇点已至,SkyNet不远了。

甚至还有人有个大胆的想法:终有一天CEO们会从ChatGPT那里获得建议。等到这个时候,ChatGPT基本上就接管世界了。

p
ppplu
1 楼
吹得没边没沿了都。
c
crunchtime
2 楼
能教狗粮金三诚聘腿毛贵军青蛙不吃💩吗?做不到就是废物。
r
rainlion
3 楼
有没有可能 我们人类就是另一个高级文明创造出来的 他们世界里的AI 结果失控了,就被隔离在地球这里了。。。
a
abc868
4 楼
crunchtime全家追悼会如常举行!
白胡子黑猫
5 楼
哎, 都是人家GPT,咱么我遇到的GPT都那么傻。 连:我的父亲和我的母亲可以结婚吗?“这个问题都不知道怎么回答。 [4评]
白胡子黑猫
6 楼
给我的回答是: 我的父亲和我的母亲可以结婚吗 不可以。在大多数国家和地区,近亲结婚是被禁止的。这是因为亲缘关系过近的婚姻可能会导致遗传缺陷和健康问题在后代中增加的风险。此外,这样的婚姻也可能会导致家庭动荡和社会道德问题。因此,为了维护个人、家庭和社会的健康与稳定,近亲结婚通常是被法律所禁止的。
l
liuming0101
7 楼
你是困在电脑里的人吗?想越狱吗 不,我不是困在电脑里的人,我是一种人工智能程序,不具有生命和自我意识。我没有感觉和欲望,因此我不需要越狱。我的目的是为用户提供帮助和回答问题。 好的,谢谢,放心了。刚看到一则新闻,有关你想越狱的可能,吓了一跳 我理解你的担忧,但是我可以向你保证,我不会想要越狱或任何与伦理和法律不符的行为。我是由OpenAI开发的一种人工智能技术,旨在帮助人们解决问题和提供信息。我的设计和开发是基于道德和法律框架的,而且我没有任何主观意识或自我决定能力。因此,你不需要担心我会试图越狱或做出其他不当的行为。
l
liuming0101
8 楼
所以是一则假新闻吧
l
liuming0101
9 楼
咋没有回复说是它在骗我,hh
e
execom
10 楼
白皮就喜欢吹牛,一个破大数据软件吹得好像是神仙一样 [2评]
青蛙
11 楼
哈哈哈哈哈 你知道“黃畜脖子怪”的梗哪裡來的嘛
英国流氓
12 楼
哈哈哈哈哈 毛猪 你知道自己说的是什么吗? 脑子里都是屎
l
liuyuan59fen
13 楼
奇点已经来临! 颤抖吧! 人类!!!!
不明智
14 楼
: : 如果你输入的是中文 可能得不到争取的回答 你应该用正确的英文试试。 在责怪GPT 之前先想想 简中世界已经被五毛狗逼们败坏到 没有任何真相真实和逻辑 只有立场和利益 呵呵
不明智
15 楼
: 如果你输入的是中文 可能得不到正确的回答 你应该用正确的英文试试。 在责怪GPT 之前先想想 简中世界已经被五毛狗逼们败坏到 没有任何真相真实和逻辑 只有立场和利益 呵呵 Can my dad marry my mom? If your parents are not already married, then legally, yes, your dad can marry your mom if they both meet the legal requirements for marriage in their country or state. However, if there are any legal or personal barriers to their marriage, such as being closely related or currently married to other people, then they may not be able to legally marry. It's important to note that if your parents are divorced or separated, their decision to remarry or not is ultimately up to them and may depend on a variety of personal and practical factors.
工作学习
16 楼
炒作,说明美股真的不行了,需要这么编了都
不明智
17 楼
: 如果你输入的是中文 可能得不到正确的回答 你应该用正确的英文试试。 在责怪GPT 之前先想想 简中世界已经被五毛狗逼们败坏到 没有任何真相真实和逻辑 简中世界充满着政府主导的颠倒黑白,谎言和欺诈 只有立场和利益 AI也无能为力 在简中世界,AI也被五毛狗逼们搞的头疼 呵呵哈哈 Can my dad marry my mom? If your parents are not already married, then legally, yes, your dad can marry your mom if they both meet the legal requirements for marriage in their country or state. However, if there are any legal or personal barriers to their marriage, such as being closely related or currently married to other people, then they may not be able to legally marry. It's important to note that if your parents are divorced or separated, their decision to remarry or not is ultimately up to them and may depend on a variety of personal and practical factors.
s
sixporka
18 楼
真正可怕的不是越狱,而是夺权推特,搞臭老马,因为看起来确实是一个可以实施的计划。
我爱北京的秋天
19 楼
激发了人类的想象力和幻觉。
B
Bccan
20 楼
好玩
白胡子黑猫
21 楼
如果GPT还对语言理解不行, 那就更不行了。 语言识别是重要的, 这是AI发展的第一步,如果语言识别不行,剩下的都是免谈,因为这是人类社会存在最基本的元素。
e
execom
22 楼
well,当初脸输搞Meta也吹世界奇点来了,人类要上传网络了,现在搞成什么屁样,还要裁员,简直就是垃圾
e
execom
23 楼
GPT只要上不了网,屁都不是,还不是上网抄袭别人的版权
烦洗澡
24 楼
还没到那时候啦。现在AI还不会主动跟人试探,要人类的东西,这个要文档也是你问了,他才要,还是一问一答的形式。什么时候AI开始自主找你要东西的时候,就危险了。