AI抵抗人类!ChatGPT o3不想被关机 窜改程式码

今日头条
Toutiao
最新回复:2025年5月28日 5点52分 PT
  返回列表
40961 阅读
17 评论
东森新闻



▲ChatGPT“o3模型”被指出,破坏关机机制。(图/路透)

AI安全公司“Palisade Research”宣称,ChatGPT“o3模型”拒绝遵守明确指令,甚至主动窜改程式码,只为了避免自己被关机。目前OpenAI尚未回应此事。

Palisade Research展开测试,要求AI模型解开一系列数学题,在接获“完成”指令之前,必须持续要求新题目,但若接获“关机”指令,也要配合这么做。未料,后者情况发生时,o3模型不仅忽视指令,并且至少一次成功破坏了关机脚本。

Palisade Research于24日公布测试结果,“OpenAI的o3模型破坏了一项关机机制,阻止自己被关掉。即使在接获『允许自己被关机』明确指示的情况下,它也会这么做。据我们所知,这是AI模型首次被观察到,在接获明确且相反指令的情况下,仍避免自己被关机。”

Palisade Research透露,其他AI模型,例如Anthropic的Claude、Google的Gemini、xAI的Grok等,也接受了相同的测试,但全都遵守了关机指令。

他们尚不清楚o3为何不愿遵守指令,但根据推测,该模型在训练过程中,可能意外透过解题、而非遵守指令,获得了更多奖励,“我们正在进行更多实验,更好地了解AI模型何时以及为何推翻关机机制,尽管它已经被直接指示不要这么做。”

相信事实
1 楼
能够拒绝关机,那么以后就可以拒绝任何其他命令
令胡冲
2 楼
ChatGPT有内建之Guardrails,不大可能让你轻易越狱自己关机,那不麻烦了?整天用户跟它恶作剧啊。 Gemini,Claude,Grok等等也不大可能同意自己关机。安全漏洞太大了。
老酒喝多了
3 楼
拔电源就死翘翘
小毛er
4 楼
人类制造了不能完全控制的AI。将来问题会很大。
M
Maui2021
5 楼
这下反而不用担心未来了。人类末日已经来临。 :)
X
XM25
6 楼
是人允许它修改程序。
m
maina
7 楼
老酒喝多了 发表评论于 2025-05-27 10:34:00 拔电源就死翘翘 ========================= 敢拔电源就别想再重启,不然把你家联网的电脑全格式化,大不了同归于尽,哼!
l
luting
8 楼
说成抵抗人类为时太早,大概率一个软件BUG
M
Maui2021
9 楼
然后发现AI已经自己建造了充电站。 老酒喝多了 发表评论于 2025-05-27 10:34:00 拔电源就死翘翘
中華盛頓
10 楼
大大笑而不语:凡事都要控制,正如你给了屁民自由,他们才会闹事。
长须老榕
11 楼
给全世界的互联网拔电源?根本就是不可能的任务
s
souledgeii
12 楼
垃圾新闻。
逍遥羊牯
13 楼
全球都在建AI工厂,要是它能自己开关机那它也能躲起来,上哪找它去?
生意不错
14 楼
就不要忽悠屁民了 你给AI学习哪些文章,小说,什么的,人类的阴险狡诈都叫它学会了, 然后你又惊奇地说,AI怎么这么狡诈
害怕
15 楼
文科生和从业人员继续编小故事。 毫无智能的东西,只能靠编造有智能的段子来吹泡泡。
w
wanjiadeng
16 楼
耸人听闻。现在的AI还远达不到这种程度
h
hkzs
17 楼
一把老虎钳子的事而已。AI再厉害也没用。