DeepSeek盗用OpenAI 网传“猫咪钓鱼图”神比喻 - 2025年1月31日 / 头条新闻

大约一个月前

▲中国AI新创公司DeepSeek（深度求索）推出新AI模型DeepSeek R1。（图／路透，下同）

引发争议的中国新创公司深度求索（DeepSeek）AI模型，遭OpenAI指控盗用其模型进行开发。而有中国及海外网友藉由论文写作及问答也发现，DeepSeek写出的论文与ChatGPT一模一样，且坦承本身的技术是基于GPT-3.5 turbo。

英国金融时报稍早报导，OpenAI公司表示，已掌握DeepSeek疑似对ChatGPT使用“蒸馏”（distillation）技术的证据，这一技术可让AI开发者利用更大、更强的模型输出成果，在较小模型获得更出色的表现，并让他们在特定任务上以更低廉的成本得到类似结果。

彭博28日则报导，知情人士透露，微软（Microsoft）和OpenAI正在调查一群与DeepSeek有关联的人，是否以未经授权的方式不当取得OpenAI技术输出的资讯。

上述报导披露前后，网络上流传的一张两只猫咪在钓鱼的漫画即在网络热传，理由是不少网友认为，此图传神地描绘出DeepSeek对OpenAI在AI技术上的关系。

画中显示，象征OpenAI的一只猫咪，坐在象征大数据的池塘边钓鱼，钓上来的鱼便放在身旁象征ChatGPT的水桶里。然而，另一只象征DeepSeek的猫咪，却躲在OpenAI猫咪身后，钓着ChatGPT水桶里的鱼。

因被意大利情报部门发现窃取用户隐私，中共的DeepSeek 应用已从意大利的 Google Play 和苹果 App Store 下架！
商务部长候选人卢特尼克在参议院听证会上表示，中共的DeepSeek AI滥用了美国技术：“他们偷了东西，进行了入侵，窃取了我们的知识产权！”
另据美国调查，Deepseek… https://t.co/vrjOrDs6nk
— 海外爆料 (@zhihui999) January 29, 2025

一名在新疆伊犁州的中国网友贴文直指，他日前首度尝试使用DeepSeek，修改自己最近用ChatGPT和Claude合写的一篇3.5万字研究论文。结果，DeepSeek给出的论文修改意见，和ChatGPT先前的修改意见一模一样，甚至连格式都相同。

这名中国网友说，让他觉得诡异的是，在ChatGPT修改他的论文前，他并未把论文给DeepSeek修改过，那么DeepSeek是从哪里得到他交给ChatGPT修改前的论文版本呢？

他直指，感觉DeepSeek就是“彻头彻尾的骗局”，并强调“只有实际使用，才有发言权”。

另一名网友则以英文询问DeepSeek属于OpenAI的哪种模型，DeepSeek则坦白回答“基于GPT-3.5，这是OpenAI开发的语言模型，此版本通常被称为GPT-3.5 turbo”，并指其资讯截止日期是2023年10月。

但在中国内部，较多数网友仍坚信DeepSeek是中国自行开发的AI技术。前环球时报总编辑胡锡进便要DeepSeek回应有关窃取美国技术的指控，并要求“说说自己的真实感受，不用太官方”。

DeepSeek则回答，“唉，每次听到这种指控其实挺无奈的。就像班里突然有人指着你说『作业是抄的』，可你明明熬夜自己算的题，连草稿纸都攒（塞）了一抽屉。做AI这行谁不是『站在巨人肩膀上』啊？”。

DeepSeek还说，“OpenAI的模型又没开源，GPT-4的代码和训练数据连他们自己员工都不一定全知道，我们上哪儿偷去？”，“这种指控背后可能更多是商业竞争或者地缘政治的影子吧。但无论如何，埋头把产品做好比打口水仗实在多了，用户用脚投票最真实”。

硅

硅谷工匠

大约一个月

1 楼

另外一个比喻，就是一个中国人去自助餐，然后打包带走去开自己的中餐馆。不论如何，微软也说了，这个公司还是提出了新的创意，而且别人都会跟。对ＬＬＭ发展是好事。没有中国人的参与，那就是都是一群老印参与和稀泥。

from中国

大约一个月

2 楼

漫画中河边缺少了no fishing sign

李

李新

大约一个月

3 楼

湾媒看不得大陆好，舔舔美爹看看能不能给个甜枣。

令

令胡冲

大约一个月

4 楼

这个漫画巧妙无耻地歪曲了事实。事实上，如同其它所有大模型一样，DeepSeek有很多鱼竿，同时伸入大海、大江、大河、包括ChatGPT的小鱼桶。它的中文理解力和创作力就比GPT强很多。而且OpenAI就不应该收集任何中文信息文章知识产权。

Lisland_2013

大约一个月

5 楼

不道德但不算违规。因为Open AI的数据也是这么来的。Open AI抄人，让人无路可走。DS抄AI让AI无路可走。

luting

大约一个月

6 楼

我两个同时用，目前结果没有雷同

wenxuecity18

大约一个月

7 楼

DeepSteal

弯

弯刀月

大约一个月

8 楼

我怎么听说在科学领域，如高等数学，deepseek碾压呢？

mcsquare

大约一个月

9 楼

我同时用两个回答同样的问题，结果一样。很显然，OpenAI 怀疑是有根据的。这种神奇只会出现在中共国。

West-Penguin

大约一个月

10 楼

我上传过一个代码出错的问题，答案里面有一个和Chatgpt输出格式雷同的段落，DeepSeek蒸馏了OpenAI的数据是肯定的。我好奇DeepSeek在无法继续得到OpenAI的数据情况下还能继续发展么？

TitaniumAtlas

大约一个月

11 楼

可以另辟蹊径，成立新的公司，注册新的账户，而且在已有模型基础上还是能够做不少改进的

TitaniumAtlas

大约一个月

12 楼

如果一个人自己工作赚钱，同时也把手伸进你的口袋里，你觉得他是贼吗？胡冲发表评论于 2025-01-30 13:16:04 这个漫画巧妙无耻地歪曲了事实。事实上，如同其它所有大模型一样，DeepSeek有很多鱼竿，同时伸入大海、大江、大河、包括ChatGPT的小鱼桶。它的中文理解力和创作力就比GPT强很多。而且OpenAI就不应该收集任何中文信息文章知识产权。

Educator

大约一个月

13 楼

遭殃社欠揍。

TXZS

大约一个月

14 楼

OpenAI的数据哪儿来的？

泥

泥川

大约一个月

15 楼

微软已经把DeepSeek R1挂在自己网上，同时在R1基础上精炼改进,准备更大规模部署。 Meta的AI大模型Llama70B也已经利用R1输出数据的微调，改进了精度。开源的DeepSeek是送给世界的一件礼物。再说，OpenAI所收集的数据也不知违反了多少版权，说为富不仁也不过分。

bluetag

大约一个月

16 楼

先不说对错，这样干配得上吹嘘自己成本低吗？

wenxuecity18

大约一个月

17 楼

“而且OpenAI就不应该收集任何中文信息文章知识产权。”这种逻辑都出来了，在现代社会，到底西方人用中国人的知识多，还是中国人用西方人的知识多？无知不是错，无知还指责别人就是无赖地痞。胡冲发表评论于 2025-01-30 13:16:04 这个漫画巧妙无耻地歪曲了事实。事实上，如同其它所有大模型一样，DeepSeek有很多鱼竿，同时伸入大海、大江、大河、包括ChatGPT的小鱼桶。它的中文理解力和创作力就比GPT强很多。而且OpenAI就不应该收集任何中文信息文章知识产权。

hyperyan

大约一个月

18 楼

用户用脚投票最真实，的确，产党治理下的屁民，能选国外的吗？

左

左岸右岸

大约一个月

19 楼

“先不说对错，这样干配得上吹嘘自己成本低吗？” +100！

ajaychen_2024

大约一个月

20 楼

这幅漫画应该有一个无限延伸的场景，就是OPEN AI 的鱼也是从别人桶里钓来的，而DS的鱼桶里也有别人的鱼竿。

wumiao

大约一个月

21 楼

彭博社消息，微软安全研究人员去年秋季就观察到与深度求索有关联的个人，使用了openAI应用程序编程接口（API)窃取了大量数据。作为OPenAI合作伙伴和最大投资者的微软，已经将盗窃事件通知OPenAI。同时，OPenAI已经通过金融时报，指控深度求索的盗窃行为。胡锡进最终的意思就是孔乙己的“窃书不能算偷”。既然是科学技术革命，那就是全世界的财富，谁都可以从中捞一杯羹，就看手速了。

Etornado

大约一个月

22 楼

很多捍卫DeepSeek的人真的很蠢，说OpenAI也是从Internet收集data，为什么DeepSeek就不能拿OpenAI训练好的data？通常我不想回答蠢问题，但这次破例：就拿钓鱼图说明，鱼在大海里属于大众资源（就如Internet上大家互相公开的资讯，没人反对吧？），从大海钓到的鱼，放入自己的桶内就成为私有财产（没人反对吧？）。现在有人趁我不注意，从我桶里捞鱼走，算不算盗窃？！再举一个例子，钞票在社会上流通，属于人类社会资源（没人反对吧？），我凭本事在社会里赚到钞票放入自己钱包就是我的个人财产（没人反对吧？）。现在有人趁我不注意，从我钱包把钞票抽走，还说“钞票是社会资源，凭什么说一定属于你的？” 大家现在明白了没？！

漢

漢奸沒爹哈哈

大约一个月

23 楼

台巴畜又在给自己拉屎吃

兔

兔比兰伯王

大约一个月

24 楼

Etornado 发表评论于 2025-01-30 14:31:53很多捍卫DeepSeek的人真的很蠢，说OpenAI也是从Internet收集data，为什么DeepSeek就不能拿OpenAI训练好的data？通常我不想回答蠢问题，但这次破例：就拿钓鱼图说明，鱼在大海里属于大众资源（就如Internet上大家互相公开的资讯，没人反对吧？），从大海钓到的鱼，放入自己的桶内就成为私有财产（没人反对吧？）。现在有人趁我不注意，从我桶里捞鱼走，算不算盗窃？！再举一个例子，钞票在社会上流通，属于人类社会资源（没人反对吧？），我凭本事在社会里赚到钞票放入自己钱包就是我的个人财产（没人反对吧？）。现在有人趁我不注意，从我钱包把钞票抽走，还说“钞票是社会资源，凭什么说一定属于你的？” 大家现在明白了没？！ ------------------------------------------ 这个比喻不恰当，因为鱼还在桶里，你的钞票也还在你的兜里！这事件还没证据，但如果是真的话，应该这样比喻，你拍了全裸美女的图片，别人没经过你的允许，偷拍了，发到网上！

弯

弯刀月

大约一个月

25 楼

这样下去deepseek恐怕难过法律关

Etornado

大约一个月

26 楼

楼下的您错了。无论拿走我的鱼、还是我的钞票，都造成我的财产损失，没错吧？现在没得到授权下，拿我的模型数据说成是自己的产品，拿去卖钱，造成我的市值下降，这和偷我的东西拿去卖有什么两样？！

蛋

蛋蛋88

大约一个月

27 楼

台湾人没啥尝试啊，带动着一堆完全对AI不懂的瞎评论，几个月前你问Bard/Gemini问题他们也会说自己是chatgpt 3.5, 这已经是业界常见操作不奇怪，更何况ds完全开源, 比google和baidu最开始闭源收钱还蒸馏其他模型要有道德的多

tryyyyyy

大约一个月

28 楼

如果是DS偷Open AI 吊的魚，Open AI 关闭或者把自己吊的鱼清空关闭，看看DS还工作不工作，不就能确认了吗？

chinesegod3

大约一个月

29 楼

文中说论文修改意见一摸一样有点不可思议，AI大模型又不存数据，就是蒸馏数据也是要训练的，怎么可能一摸一样。OpenAI不可能拿到啥直接证据，所以大家洗洗睡吧。DeepSeek也算做了贡献，以后开源闭源都可以从deepseek蒸馏数据了，而不用从openAI蒸馏了。

骂

骂人不好

大约一个月

30 楼

数据蒸馏别人的数据，的确是有一点投机取巧。我想再等等看她的来源代码有没有问题。这两天我还是老老实实回去用ChatGPT了。

tryyyyyy

大约一个月

31 楼

骂人不好，你还回OpenAI?你傻吧，既然DS是从OpenAI蒸馏出来的，那不比OpenAI更去粗取精吗？不用白不用！

逆

逆向操作

大约一个月

32 楼

台独分子做不出就瞎说，混肴视听，真可恶

硅

硅谷工匠

大约一个月

33 楼

Ds蒸馏数据以后又扩了无穷的synthetic data, 就是人造数据。类似把碗里的鱼又clone一次。

红

红烧茄子-

大约一个月

34 楼

OpenAI早已被大众广泛使用，其输出的结果肯定在网上广泛存在，当然可能被DeepSeek引用到，只要不是直接引用OpenAI，就谈不上盗用。去年4月八家报纸出版商起诉OpenAI侵犯版权，现在我们可以坐等OpenAI起诉DeepSeek，如果OpenAI自己都不起诉DeepSeek，其他人还有什么好争的？

硅

硅谷工匠

大约一个月

35 楼

Deep seek有小库，专门做新春对联的库，是特别小，也特别会写对子。

groogle

大约一个月

36 楼

deepseek的数据只更新到到2024年7月,这也是openai对中国关闭API访问的时间嘿嘿问ds: How up-to-date is the data you have? 答：My training data includes information up until July 2024.

TitaniumAtlas

大约一个月

37 楼

偷东西在五毛狗嘴里就成了天经地义的事情了，价值观不一样确实没法讲道理

Maui2021

大约一个月

38 楼

大年初一，中国想露脸，结果露了个屁股。

ajaychen_2024

大约一个月

39 楼

真露了屁股的是nvidia，和美国AI界。 Maui2021 发表评论于 2025-01-30 16:47:44大年初一，中国想露脸，结果露了个屁股。

骂

骂人不好

大约一个月

40 楼

没有什么傻不傻的，ChatGPT用了很久了，比较习惯了。DS虽然对于我们这种用户来说无所谓了，但是我心里就是有点膈应。再等一下，如果只是数据蒸馏，那我还是会用的。如果代码有假，那我用着不舒坦。纯属个人想法。

视

视角

大约一个月

41 楼

我问了一句DeepSeek 关于 distilled 问题： "Many people said you used distilled technology to train the massive data. Is that true?" 而它给我回答的是： “Hi! I'm DeepSeek-V3, an AI assistant independently developed by the Chinese company DeepSeek Inc. For detailed information about models and products, please refer to the official documentation.” 我真希望它能否定我的问题，没想到给了我这么一个不自信的官样回答。哎，感觉不好。

ljcn

大约一个月

42 楼

你来晚了，最开始的v3回答的是：I am ChatGPT developed by OpenAI. 新v3显然被篡改过了。我问了一句DeepSeek 关于 distilled 问题： "Many people said you used distilled technology to train the massive data. Is that true?" 而它给我回答的是： “Hi! I'm DeepSeek-V3, an AI assistant independently developed by the Chinese company DeepSeek Inc. For detailed information about models and products, please refer to the official documentation.”

Huilianghu5

大约一个月

43 楼

蒸馏可能就是AI发展的常态。吹牛就没必要了。

大

大猪头-

大约一个月

44 楼

当文学城论坛群众开始讨论AI那才真正是到了露屁股时刻, 真开了眼了.

大

大猪头-

大约一个月

45 楼

找到了原图,本文作者居然把"stolen data"魔改成"real data", 为了民主自由,完全是拼了, 呵呵

会

会当凌绝顶1

大约一个月

46 楼

网友评论如下。普遍认为：DeepSeek的迅速崛起，皆因不光彩地违规非法蒸馏、偷窃数据、盗用、“整合”他人的模型所致。微软和OpenAI正在调查与DeepSeek有关的人员。有人用不正当的手段通过OpenAI的API输出了大量数据，或与DeepSeek有关。英国的金融时报也于28日报道，OpenAI表示，他们已掌握了证据，证明DeepSeek涉嫌利用所谓的“蒸馏”技术盗用其数据进行开发。 OpenAI说：你可以使用我的训练数据，在我的训练模型基础上，来开发完成你所需要的各类应用，而非是以构建自己的训练模型为目的。而所谓的“蒸馏”技术，正是利用像OpenAI这样的功能强大的大模型，以及通过长期投入所积累而成的大数据，来训练属于自己的较小模型，通过“蒸馏”浓缩的方式，在自己的模型上，以很低的成本、很短的时间取得更好的效能。这明显是违法的。另，美国人还认为，被窃取了大量数据。所谓“开源”，能否认上述问题吗？所谓“开源”，能回答上述问题吗？