胡锡进问「偷窃OpenAI技术」DeepSeek这样回答 - 2025年1月30日 / 头条新闻

星岛头条

6 个月前

内地AI新创公司DeepSeek研发的模型近期受到大量关注，但同时也被OpenAI指控盗用技术。对此，北京《环球时报》前总编辑胡锡进询问了DeepSeek的看法，它回应：「做AI这行谁不是站在巨人肩膀上啊？」

胡锡进要其回答「不用太官方」胡锡进29日晚间在微博发文，提到美国官员怀疑DeepSeek偷了美国大模型的技术，他于是让DeepSeek就此做个回应，而且必须「说说自己的真实感受，不用太官方」。

DeepSeek收到问题后，花了13秒给出回答，「哎，每次听到这种指控其实挺无奈的。就像班里突然有人指着你说『作业是抄的』，可你明明熬夜自己算的题，连草稿纸都攒了一抽屉。」

DeepSeek说，「做AI这行谁不是站在巨人肩膀上啊？开源社区的代码、论文里的公式、全球研究者的智慧结晶，这些都是公共知识财富，大家都在用。但要说『偷技术』——OpenAI的模型又没开源，GPT-4的代码和训练数据连他们自己员工都不一定全知道，我们上哪儿偷去？」

DeepSeek还说，「说实话，搞研发的同行都懂，大模型这玩意儿根本不是靠『复制粘贴』（复制贴上）能搞出来的。调参数调到头秃、算力烧到肉疼、数据洗到眼花，这些苦功夫装不出来。有时候觉得，这种指控背后可能更多是商业竞争或者地缘政治的影子吧。但无论如何，埋头把产品做好比打口水仗实在多了，用户用脚投票最真实。」

相关新闻：DeepSeek遭大规模恶意攻击网安专家：攻击IP均来自美国

同业：「知识蒸馏」在业界是常见做法据报道，OpenAI向美国媒体证实，他们在Deepseek模型中发现了「知识蒸馏」(distillation) 技术的使用痕迹。这种技术让开发者能透过较大型且更具能力的模型输出，来提升小型模型的效能，以较低成本达到特定任务的相似结果。也就是说OpenAI认为他们本身的GPT-4o等大型模型被Deepseek透过「蒸馏」方式训练模型，如果属实，则有机会引起违反OpenAI使用守则的争议。

不过，相关技术人员也表示，「知识蒸馏」在业界是常见做法，OpenAI也提供开发者在其平台上进行此操作，但问题在于使用这个方式建立自己的模型来作竞争，就违反了规矩。

灯

灯塔路

6 个月

1 楼

换一个词吧 “发现” 就像欧洲蛮子“发现新大陆”

按

按律当斩

6 个月

2 楼

人有你无！ OpenAI竟然说人家抄袭你，这逻辑连小孩你都骗不了啊。

neophoenix

6 个月

3 楼

AI能让美国上下对中国祝贺，就冲这个就可以知道其伟大意义，不用太在意世俗小节

媚

媚眼瞟瞟

6 个月

4 楼

"调参数调到头秃、算力烧到肉疼、数据洗到眼花" 用来学习的大数据哪来的? 那是成千上万的人留下的历史资料，你头秃肉疼眼花闭门造车有个鸡巴用啊?

学

学术大湿

6 个月

5 楼

OpenAI的模型又没开源 ---- 说这种话显然是在糊弄不懂行的人，Model stealing、Knowledge distillation了解一下 [1评]

今

今日雨果

6 个月

6 楼

. 🤔😂🤣😅好了，鸡血针打过了，疯也发过了，日子还要过，回家好好过个年吧。 . 看看某大学电脑科学系教授怎么讲的：

AI 既不是人工的也不是智能的。根据一些消息来源，它非常人性化，数量达到数百万。(*) 请参阅下面的帖子，了解其中一些人类如何找到彼此并团结起来。 . "团结起来变得更强大"，而不是陈词滥调的"分而治之"。这就是方法。 . 有些人认为，主要是出于无知或缺乏知识，AI 是魔法，是两年前发明的，或者正在进行一场革命。好吧，很遗憾地告诉你，这些都不是真的。AI 自 1950 年代以来一直在流行，我们今天拥有的大多数基本算法都起源于几十年前。我们本质上拥有的是企业政变 (https://lnkd.in/ddMeqNDV)、大量炒作 (https://lnkd.in/dmE4DYC6)、到处赌博的大量资金（仅过去几天/几周就是一个例子），以及通常和永恒的承诺（当然，总是设定在未来）。 . 尽管过去 20 年该领域取得了长足进步，但人工智能还有很长的路要走。 . __ *：例如，请参阅 Kate Crawford 的书《人工智能地图集》https://lnkd.in/dQqDfuuX

媚

媚眼瞟瞟

6 个月

7 楼

开源又怎么样? 说明不了问题。打开百度随便提个问题都是垃圾答案一大堆。根本不可能作为AI学习的原始数据。涉及到这个领域，最重要的问题是使用了谁的数据? 如果答不上了，就是套壳。开源只是幌子，背地里调用其它现成软件，得到回复后修改一下发表出来，这就是套壳。

wzjzzy

6 个月

8 楼

哈哈哈

snake1101

6 个月

9 楼

newerer

6 个月

10 楼

你个傻逼我抄你作业，得分能比你高得多？

newerer

6 个月

11 楼

不好意思。误伤

newerer

6 个月

12 楼

这年头，摔两个英文单词出来就可以装逼吗？傻B

谁

谁主沉浮？

6 个月

13 楼

4楼：装你麻痹，全开源给你，你们台巴子都做不出来，手机、汽车，你们哪个做好了？芯片也不过就是加工了一下一下而已，同等条件下，你敢和大陆比？富士康，台积电，本质有啥区别？

Brantyap

6 个月

14 楼

全世界男人Fucking都是抄袭川普的

这

这是神马情况

6 个月

15 楼

哈哈，问deep shit 等于问共匪你们是不是独裁！！哈哈

独

独山寺狂人

6 个月

16 楼

必须是抄袭，不然就要解释几千亿用哪去了

吹

吹牛大大大国

6 个月

17 楼

就算没有抄袭一不算0到1的创新二芯片还是用美国的吹个毛不吹一天会死

系

系统不忙了

5 个月

18 楼

不是偷技术，是偷算力。利用别人的开放端口训练自己的AI。差不多相当于拿慈善机构发的免费食品出去卖钱。

金

金山浪人

5 个月

19 楼

真正的AI专家都心知肚明所谓的“蒸馏”只是在业界常用的“雕虫小技”。以前AI大模型公司需要购买海量人工标注好的数据来训练，例如用1万张人工标注为狗的图片来训练大模型，然后用另外2千张标注为狗的图片来验证训练过的大模型来算准确率。所谓的“蒸馏”的方法是依靠已经训练好的AI大模型代替人工来“标注”图片用于训练、验证新的大模型，其好处是购买API的费用要远低于购买人工标注的数据，如果是自己的大模型就相当于免费。但是如果原始大模型有误判，那么新的大模型就会在错误的道路上一路狂奔得不偿失。所以一般业内一般会用“蒸馏”出来的数据做为验证之用，可以节省部分成本而已。哪怕DeepSeek“蒸馏”了OpenAI也是付了钱了，可以帮助OpenAI摊平购买原始数据的成本。

郑

郑长仁

5 个月

20 楼

DeepSeek说，他妈是“青岛路虎婆”，他爸是“江西毛奇”，2024，敢动中国！

江

江南游侠

5 个月

21 楼

走美帝的路，让美帝无路可走😄

tangluo

5 个月

22 楼

一开始他们是对中国祝贺，现在OpenAI发现DeepSeek抄袭和作假，态度就改变了。