DeepSeek盗用OpenAI 网传“猫咪钓鱼图”神比喻

今日头条
Toutiao
最新回复:2025年1月30日 16点25分 PT
  返回列表
13930 阅读
37 评论
中央社



▲中国AI新创公司DeepSeek(深度求索)推出新AI模型DeepSeek R1。(图/路透,下同)

引发争议的中国新创公司深度求索(DeepSeek)AI模型,遭OpenAI指控盗用其模型进行开发。而有中国及海外网友藉由论文写作及问答也发现,DeepSeek写出的论文与ChatGPT一模一样,且坦承本身的技术是基于GPT-3.5 turbo。

英国金融时报稍早报导,OpenAI公司表示,已掌握DeepSeek疑似对ChatGPT使用“蒸馏”(distillation)技术的证据,这一技术可让AI开发者利用更大、更强的模型输出成果,在较小模型获得更出色的表现,并让他们在特定任务上以更低廉的成本得到类似结果。

彭博28日则报导,知情人士透露,微软(Microsoft)和OpenAI正在调查一群与DeepSeek有关联的人,是否以未经授权的方式不当取得OpenAI技术输出的资讯。

上述报导披露前后,网络上流传的一张两只猫咪在钓鱼的漫画即在网络热传,理由是不少网友认为,此图传神地描绘出DeepSeek对OpenAI在AI技术上的关系。

画中显示,象征OpenAI的一只猫咪,坐在象征大数据的池塘边钓鱼,钓上来的鱼便放在身旁象征ChatGPT的水桶里。然而,另一只象征DeepSeek的猫咪,却躲在OpenAI猫咪身后,钓着ChatGPT水桶里的鱼。

因被意大利情报部门发现窃取用户隐私,中共的DeepSeek 应用已从意大利的 Google Play 和苹果 App Store 下架!
商务部长候选人卢特尼克在参议院听证会上表示,中共的DeepSeek AI滥用了美国技术:“他们偷了东西,进行了入侵,窃取了我们的知识产权!”
另据美国调查,Deepseek… https://t.co/vrjOrDs6nk

— 海外爆料 (@zhihui999) January 29, 2025


一名在新疆伊犁州的中国网友贴文直指,他日前首度尝试使用DeepSeek,修改自己最近用ChatGPT和Claude合写的一篇3.5万字研究论文。结果,DeepSeek给出的论文修改意见,和ChatGPT先前的修改意见一模一样,甚至连格式都相同。

这名中国网友说,让他觉得诡异的是,在ChatGPT修改他的论文前,他并未把论文给DeepSeek修改过,那么DeepSeek是从哪里得到他交给ChatGPT修改前的论文版本呢?

他直指,感觉DeepSeek就是“彻头彻尾的骗局”,并强调“只有实际使用,才有发言权”。



另一名网友则以英文询问DeepSeek属于OpenAI的哪种模型,DeepSeek则坦白回答“基于GPT-3.5,这是OpenAI开发的语言模型,此版本通常被称为GPT-3.5 turbo”,并指其资讯截止日期是2023年10月。

但在中国内部,较多数网友仍坚信DeepSeek是中国自行开发的AI技术。前环球时报总编辑胡锡进便要DeepSeek回应有关窃取美国技术的指控,并要求“说说自己的真实感受,不用太官方”。

DeepSeek则回答,“唉,每次听到这种指控其实挺无奈的。就像班里突然有人指着你说『作业是抄的』,可你明明熬夜自己算的题,连草稿纸都攒(塞)了一抽屉。做AI这行谁不是『站在巨人肩膀上』啊?”。

DeepSeek还说,“OpenAI的模型又没开源,GPT-4的代码和训练数据连他们自己员工都不一定全知道,我们上哪儿偷去?”,“这种指控背后可能更多是商业竞争或者地缘政治的影子吧。但无论如何,埋头把产品做好比打口水仗实在多了,用户用脚投票最真实”。

 

硅谷工匠
1 楼
另外一个比喻,就是一个中国人去自助餐,然后打包带走去开自己的中餐馆。 不论如何,微软也说了,这个公司还是提出了新的创意,而且别人都会跟。对LLM发展是好事。没有中国人的参与,那就是都是一群老印参与和稀泥。
f
from中国
2 楼
漫画中 河边缺少了no fishing sign
李新
3 楼
湾媒看不得大陆好,舔舔美爹看看能不能给个甜枣。
令胡冲
4 楼
这个漫画巧妙无耻地歪曲了事实。事实上,如同其它所有大模型一样,DeepSeek有很多鱼竿,同时伸入大海、大江、大河、包括ChatGPT的小鱼桶。它的中文理解力和创作力就比GPT强很多。而且OpenAI就不应该收集任何中文信息文章知识产权。
L
Lisland_2013
5 楼
不道德但不算违规。因为Open AI的数据也是这么来的。Open AI抄人,让人无路可走。DS抄AI让AI无路可走。
l
luting
6 楼
我两个同时用,目前结果没有雷同
w
wenxuecity18
7 楼
DeepSteal
弯刀月
8 楼
我怎么听说在科学领域,如高等数学,deepseek碾压呢?
m
mcsquare
9 楼
我同时用两个回答同样的问题,结果一样。很显然,OpenAI 怀疑是有根据的。这种神奇只会出现在中共国。
W
West-Penguin
10 楼
我上传过一个代码出错的问题,答案里面有一个和Chatgpt输出格式雷同的段落,DeepSeek蒸馏了OpenAI的数据是肯定的。我好奇DeepSeek在无法继续得到OpenAI的数据情况下还能继续发展么?
T
TitaniumAtlas
11 楼
可以另辟蹊径,成立新的公司,注册新的账户,而且在已有模型基础上还是能够做不少改进的
T
TitaniumAtlas
12 楼
如果一个人自己工作赚钱,同时也把手伸进你的口袋里,你觉得他是贼吗? 胡冲 发表评论于 2025-01-30 13:16:04 这个漫画巧妙无耻地歪曲了事实。事实上,如同其它所有大模型一样,DeepSeek有很多鱼竿,同时伸入大海、大江、大河、包括ChatGPT的小鱼桶。它的中文理解力和创作力就比GPT强很多。而且OpenAI就不应该收集任何中文信息文章知识产权。
E
Educator
13 楼
遭殃社欠揍。
T
TXZS
14 楼
OpenAI的数据哪儿来的 ?
泥川
15 楼
微软已经把DeepSeek R1挂在自己网上,同时在R1基础上精炼改进,准备更大规模部署。 Meta的AI大模型Llama70B也已经利用R1输出数据的微调,改进了精度。 开源的DeepSeek是送给世界的一件礼物。 再说,OpenAI所收集的数据也不知违反了多少版权,说为富不仁也不过分。
b
bluetag
16 楼
先不说对错,这样干配得上吹嘘自己成本低吗?
w
wenxuecity18
17 楼
“而且OpenAI就不应该收集任何中文信息文章知识产权。”这种逻辑都出来了,在现代社会,到底西方人用中国人的知识多,还是中国人用西方人的知识多?无知不是错,无知还指责别人就是无赖地痞。 胡冲 发表评论于 2025-01-30 13:16:04 这个漫画巧妙无耻地歪曲了事实。事实上,如同其它所有大模型一样,DeepSeek有很多鱼竿,同时伸入大海、大江、大河、包括ChatGPT的小鱼桶。它的中文理解力和创作力就比GPT强很多。而且OpenAI就不应该收集任何中文信息文章知识产权。
h
hyperyan
18 楼
用户用脚投票最真实,的确,产党治理下的屁民,能选国外的吗?
左岸右岸
19 楼
“先不说对错,这样干配得上吹嘘自己成本低吗?” +100!
a
ajaychen_2024
20 楼
这幅漫画应该有一个无限延伸的场景,就是OPEN AI 的鱼也是从别人桶里钓来的,而DS的鱼桶里也有别人的鱼竿。
w
wumiao
21 楼
彭博社消息,微软安全研究人员去年秋季就观察到与深度求索有关联的个人,使用了openAI应用程序编程接口(API)窃取了大量数据。作为OPenAI合作伙伴和最大投资者的微软,已经将盗窃事件通知OPenAI。同时,OPenAI已经通过金融时报,指控深度求索的盗窃行为。 胡锡进最终的意思就是孔乙己的“窃书不能算偷”。既然是科学技术革命,那就是全世界的财富,谁都可以从中捞一杯羹,就看手速了。
E
Etornado
22 楼
很多捍卫DeepSeek的人真的很蠢,说OpenAI也是从Internet收集data,为什么DeepSeek就不能拿OpenAI训练好的data?通常我不想回答蠢问题,但这次破例: 就拿钓鱼图说明,鱼在大海里属于大众资源(就如Internet上大家互相公开的资讯,没人反对吧?),从大海钓到的鱼,放入自己的桶内就成为私有财产(没人反对吧?)。现在有人趁我不注意,从我桶里捞鱼走,算不算盗窃?! 再举一个例子,钞票在社会上流通,属于人类社会资源(没人反对吧?),我凭本事在社会里赚到钞票放入自己钱包就是我的个人财产(没人反对吧?)。现在有人趁我不注意,从我钱包把钞票抽走,还说“钞票是社会资源,凭什么说一定属于你的?” 大家现在明白了没?!
漢奸沒爹哈哈
23 楼
台巴畜又在给自己拉屎吃
兔比兰伯王
24 楼
Etornado 发表评论于 2025-01-30 14:31:53很多捍卫DeepSeek的人真的很蠢,说OpenAI也是从Internet收集data,为什么DeepSeek就不能拿OpenAI训练好的data?通常我不想回答蠢问题,但这次破例: 就拿钓鱼图说明,鱼在大海里属于大众资源(就如Internet上大家互相公开的资讯,没人反对吧?),从大海钓到的鱼,放入自己的桶内就成为私有财产(没人反对吧?)。现在有人趁我不注意,从我桶里捞鱼走,算不算盗窃?! 再举一个例子,钞票在社会上流通,属于人类社会资源(没人反对吧?),我凭本事在社会里赚到钞票放入自己钱包就是我的个人财产(没人反对吧?)。现在有人趁我不注意,从我钱包把钞票抽走,还说“钞票是社会资源,凭什么说一定属于你的?” 大家现在明白了没?! ------------------------------------------ 这个比喻不恰当,因为鱼还在桶里,你的钞票也还在你的兜里! 这事件还没证据,但如果是真的话,应该这样比喻, 你拍了全裸美女的图片,别人没经过你的允许,偷拍了,发到网上!
弯刀月
25 楼
这样下去deepseek恐怕难过法律关
E
Etornado
26 楼
楼下的您错了。无论拿走我的鱼、还是我的钞票,都造成我的财产损失,没错吧?现在没得到授权下,拿我的模型数据说成是自己的产品,拿去卖钱,造成我的市值下降,这和偷我的东西拿去卖有什么两样?!
蛋蛋88
27 楼
台湾人没啥尝试啊,带动着一堆完全对AI不懂的瞎评论,几个月前你问Bard/Gemini问题他们也会说自己是chatgpt 3.5, 这已经是业界常见操作不奇怪,更何况ds完全开源, 比google和baidu最开始闭源收钱还蒸馏其他模型要有道德的多
t
tryyyyyy
28 楼
如果是DS偷Open AI 吊的魚,Open AI 关闭或者把自己吊的鱼清空关闭,看看DS还工作不工作,不就能确认了吗?
c
chinesegod3
29 楼
文中说论文修改意见一摸一样有点不可思议,AI大模型又不存数据,就是蒸馏数据也是要训练的,怎么可能一摸一样。OpenAI不可能拿到啥直接证据,所以大家洗洗睡吧。DeepSeek也算做了贡献,以后开源闭源都可以从deepseek蒸馏数据了,而不用从openAI蒸馏了。
骂人不好
30 楼
数据蒸馏别人的数据,的确是有一点投机取巧。我想再等等看她的来源代码有没有问题。这两天我还是老老实实回去用ChatGPT了。
t
tryyyyyy
31 楼
骂人不好,你还回OpenAI?你傻吧,既然DS是从OpenAI蒸馏出来的,那不比OpenAI更去粗取精吗?不用白不用!
逆向操作
32 楼
台独分子做不出就瞎说,混肴视听,真可恶
硅谷工匠
33 楼
Ds蒸馏数据以后又扩了无穷的synthetic data, 就是人造数据。类似把碗里的鱼又clone一次。
红烧茄子-
34 楼
OpenAI早已被大众广泛使用,其输出的结果肯定在网上广泛存在,当然可能被DeepSeek引用到,只要不是直接引用OpenAI,就谈不上盗用。 去年4月八家报纸出版商起诉OpenAI侵犯版权,现在我们可以坐等OpenAI起诉DeepSeek,如果OpenAI自己都不起诉DeepSeek,其他人还有什么好争的?
硅谷工匠
35 楼
Deep seek有小库,专门做新春对联的库,是特别小,也特别会写对子。
g
groogle
36 楼
deepseek的数据只更新到到2024年7月,这也是openai对中国关闭API访问的时间 嘿嘿 问ds: How up-to-date is the data you have? 答:My training data includes information up until July 2024.
T
TitaniumAtlas
37 楼
偷东西在五毛狗嘴里就成了天经地义的事情了,价值观不一样确实没法讲道理