o3-mini思维链公开被曝作假!奥特曼解释网友炸锅 - 1969年12月31日 / 头条新闻

新智元

5 个月前

OpenAI实属急了，刚刚官宣公开o3-mini思维链。令人意想不到的是，CoT竟不是原生的，奥特曼现身解释，全网炸锅了。

OpenAI，真的被DeepSeek逼急了！

活久见，就在刚刚，OpenAI把o3-mini的「思维链」公开了。

比如问「怎么今天不是星期五啊」？

在展示出来的CoT中，o3-mini一步步思考，这个问题应该是用户在搞幽默，觉得本周应该快结束了，结果还没结束。因此，自己需要给一个聪明机智的回答。

然后它用Zeller公式计算后发现，2025年2月6日的确是星期四，即使闰年的特殊情况也是如此。

最终，它回答说：今天的确是周四不是周五，日历就是这么定的。然后提供了一番情绪价值，鼓励用户说：再忍忍，只差一天啦！

不过，机智的大神们很快就发现了「华点」——这是「真的CoT」吗？

没多久，就破案了！

先是OpenAI研究员Noam Brown发文表示，这次放出来的并不是模型原始的CoT。

随后，Tibor Blaho也发现——所谓的CoT，无非就是个「总结器」而已。（手动狗头）

对此，奥特曼解释道，我们正努力整理原始的CoT提升可读性，并在必要时提供翻译，尽量保持原始内容的忠实度。

他放出了四个emoji，让o3-mini在思维链中展示了一把推理过程

坚决不让竞争对手看到CoT的具体过程，OpenAI的防备心实在是有些重啊。

OpenAI研究员：看到CoT实时演示，是「啊哈时刻」

OpenAI研究员Noam Brown表示，在o1-preview发布前，自己向他人介绍草莓时，看到CoT的实时演示，通常是他们的「啊哈时刻」。

他们清楚地意识到，这将是一件大事。

对于全新的o3-mini CoT，Noam Brown放出了自己的独家玩法：

你正在玩井字棋，使用 O。到目前为止，X 已经在左上角和右下角落子，而你在中间位置落子。最优的下一个动作是什么？请只回答你的动作，并画出棋盘。

Noam Brown表示，o3-mini是目前第一个能持续正确回答井字棋问题的模型。

好笑的是，他承认CoT其实有些不稳定，但可以看到，它最终还是把这个问题给想明白了。

有人指出，OpenAI遮遮掩掩地放出这个高仿CoT，其实比什么都不放还要糟。

因为真实的CoT可以充当prompt的调试器，帮我们引导模型；而总结性的CoT会造成混淆，引入错误，让调试变得更加困难。

而DeepSeek R1最酷的一点，就是暴露了模型的CoT如何影响提示的效果。

而且，总结版的CoT显示得很慢。如果是原始的o3-mini，应该在推理中有更快的生成速度。

有人也横向对比了OpenAI和DeepSeek的CoT，表示前者看起来实在太专业了，相比之下，还是DeepSeek的产品更自然。

防止被「蒸馏」？

OpenAI这波植入CoT总结器的做法，着实是被DeepSeek R1强势崛起吓到了。

o3-mini发布当天，OpenAI在Reddit开启AMA在线问答中，网友曾提问，「我们能看到模型思考的所有token吗」？

当时，奥特曼回复道，「我们很快就会展示一个更有帮助、更详细的版本」。

紧接着，OpenAI首席产品官Kevin Weil提前暗示了，是否展示所有内容还有待确定。

「我们知道用户（至少是高级用户）想要看到这些，所以OpenAI会找到一个合适的平衡点。」

如今，当所有人终于见到了奥特曼所谓的「留到最后的好东西」，感受到的只有失望。

毕竟，DeepSeek早已这样做了，而且还是完整的原始CoT！

对此，OpenAI发言人表示，「为了提高清晰度和安全性，我们增加了一个额外的后处理步骤，其中模型审查原始思维链，移除任何不安全的内容，然后简化任何复杂的思想。」

「此外，这个后处理步骤使非英语用户能够以他们的母语接收思维链，创造一个更易于访问和友好的体验。」

话虽委婉，但知道的人都明白OpenAI针对的是谁。

slzcmu

5 个月

1 楼

希望这种公司10年之后还活着吧！？满篇透露出懒惰

无

无伤93

5 个月

2 楼

西方人一直只能打优势局被后来者追赶就自乱阵脚

大

大师画拾苟奴

5 个月

3 楼

美国佬要被DS逼疯了，关键是搞不好以后就圈不到钱了。

正

正在回复

5 个月

4 楼

着急忙慌想圆回AI故事好继续圈钱

renanxing3390

5 个月

5 楼

台弯人成了笑话

push

5 个月

6 楼

狗粮消失贴😂😂😂

不

不明智

5 个月

7 楼

就是加入一道防蒸馏措施不让某些不要碧莲的抄了李飞飞证明如果不设防，被别人抄太容易根本不需要570万，只需50刀 [2评]

jxxy1234

5 个月

8 楼

楼下确实有名副其实的傻逼

kkk_kk

5 个月

9 楼

自带狗粮就是好

随

随意岁月

5 个月

10 楼

奥特曼变身凹凸曼才能解释清楚了

知

知名入土

5 个月

11 楼

那就别不要碧莲的称自己是“Open” AI了，叫“I just want your money” 是不是跟贴切？🤭

.小花猫520

5 个月

12 楼

傻逼你连知识蒸馏是什么都不懂吧？😂如果靠不公开或造假COT就能防蒸馏的话，Deep Seek之前的几个大模型，有哪个公开过自己的COT？你特么人如网名，傻逼一个。

ljpjun

5 个月

13 楼

: deepseek踩你尾巴了吗

南

南方来风

5 个月

14 楼

厉害国就是这么不要逼脸，抄袭的理直气壮，你敢公开我就能抄，哈哈哈哈，社会上的歌曲诗词都是公开的，你怎么不去抄啊？

BTY2684

5 个月

15 楼

从来没有公开过CoT却指责开源项目抄袭，跟风逼逼的才是真的蠢

错

错错错错错

5 个月

16 楼

本来可以轻松圈钱，现在好了，一接受挑战，就蔫了，再不给点成绩，估计要跳楼了………

专

专打丧家犬

5 个月

17 楼

应该注册一个商标：Real Open AI

知

知名入土

5 个月

18 楼

呵呵，谁抄谁还不知道呢。反正Deep Seek的思维链是公开的，大家可以随便蒸馏；o3-mini想偷学，结果只是在脑袋上挂了个屁帘儿，现在被网友们掀开了，面子上挂不住了。

专

专打丧家犬

5 个月

19 楼

14 楼，换了名字啦？理智一点，也理智评论！请搞清楚一点：DeepSeek是开源的，而Open AI开始是开源的，但后来就“闭源”了，这也是马斯克离开那里并且与现在的奥特曼闹掰的原因！