DeepSeek遭OpenAI和Claude围剿 美国网友看不下去了

今日头条
Toutiao
最新回复:2025年1月30日 12点54分 PT
  返回列表
53931 阅读
27 评论
量子位

顶级“礼遇”。

一觉醒来,OpenAI和Claude母公司都对DeepSeek出手了。

据《金融时报》消息,OpenAI表示已经发现证据,证明DeepSeek利用他们的模型进行训练,这涉嫌侵犯知识产权。

具体来说,他们发现了DeepSeek“蒸馏”OpenAI模型的迹象。即使用更大模型的输出来提高较小模型的性能,从而以较低成本在特定任务上取得类似结果。

微软也开始调查DeepSeek是否使用OpenAI的API。

消息一出,最先迎来的是一波嘲讽。

纽约大学教授马库斯率先开喷:

OpenAI:我们需要免费用所有艺术家和作家的作品训练模型,这样我们就可以省下钱去起诉DeepSeek公然偷我们东西啦!

知名技术媒体404 Media创始人及主编Jason也直接在文章里贴脸开大,暗讽OpenAI只许州官放火。

先容我笑一会儿哈哈哈哈哈哈。真是令人难以置信的讽刺啊,OpenAI一直以“未经授权的方式”获取大量数据,也违反了一些组织的条款规定,结果现在他们却在指责自己的做法。

而另一边,Claude母公司Anthropic创始人Dario Amodei洋洋洒洒发了一篇长文大谈DeepSeek。

他表示,说DeepSeek构成威胁太夸张了,“也就是我们7-10个月前的水准”,Claude 3.5 Sonnet在许多内部和外部评估中依旧遥遥领先。

不过为了保持领先,我建议我们是不是得设置更多掣肘?

好家伙,为了围剿DeepSeek,竞对OpenAI和Anthropic罕见都罕见联手了。

相比之下,微软的做法就耐人寻味了许多。

就在指控DeepSeek涉嫌侵权之后几个小时后,微软的AI平台上接入了DeepSeek模型。

网友:俗话说,否认是接受的第一步。

AI领域常见技术,但违反OpenAI条款

各方消息汇总来看,微软和OpenAI对DeepSeek的质疑还处于调查中。

根据微软工作人员的说法,DeepSeek可能在去年秋天调用了OpenAI的API,这可能导致数据泄露。

按照OpenAI的服务条款规定,任何人都可以注册使用OpenAI的API,但是不能使用输出数据训练对OpenAI造成竞争威胁的模型。

OpenAI告诉《金融时报》,他们发现了一些模型蒸馏的证据,他们怀疑这是DeepSeek的所作所为。

目前,OpenAI拒绝进一步置评,也不愿提供证据细节。

那么不妨先来看看,引发争议的模型蒸馏是什么。

它是一种模型压缩技术,通过将一个复杂的、计算开销大的大模型(称为

教师模型

)的知识“蒸馏”到一个更小、更高效的模型(称为

学生模型

)。

这个过程的核心目标是让学生模型在轻量化的同时,尽量保留教师模型的性能。

在诺奖得主、深度学习之父Hinton的论文《Distilling the Knowledge in a Neural Network》中指出:

蒸馏对于将知识从集成或从大型高度正则化模型转移到较小的蒸馏模型非常有效。

比如Together AI前段时间的工作,就是把Llama 3蒸馏到Mamba,实现推理速度最高提升1.6倍,性能还更强。

IBM对知识蒸馏的文章中也提到,大多数情况下最领先的LLM对计算、成本提出太高要求……知识蒸馏已经成为一种重要手段,能将大模型的先进能力移植到更小的(通常是)开源模型中。因此,它已经成为生成式AI普惠化的一个重要工具。

在行业内,一些开源模型的服务条款允许蒸馏。比如Llama,DeepSeek此前也在论文中表示使用了Llama。

而且关键是,DeepSeek R1并非只是简单蒸馏模型,OpenAI首席科学家Mark Chen表示:

DeepSeek独立发现了OpenAI在实现o1过程中所采用的一些核心理念。

同时他也认可了DeepSeek在成本控制上的工作,并提到蒸馏技术的趋势,表示OpenAI也在积极探索模型压缩和优化技术,降低成本。

所以总结一下,模型蒸馏技术在学术界、工业界都非常普遍且被认可,但是违反OpenAI的服务条款。

这河狸吗?不知道。

但问题是,OpenAI自己本身在合规性上也大有问题。

(众所周知)OpenAI训练模型把互联网上的数据扒了个干净,这其中除了免费公开的知识内容外,还包含大量有版权的文章作品。

2023年12月,《纽约时报》以侵犯知识产权为由,将微软OpenAI一起告上法庭。目前这个官司还没有最终判定结果,OpenAI这一年时间里就自己的行为向法院进行多次解释。

包括但不限于:

1、使用公开可获得的互联网资料训练AI模型是合理的,这在AI领域内有诸多先例,我们认为这对创作者是公平的,对于创新是必要的。

2、长期以来,版权著作被非商业性使用(比如训练大模型)是受到合理保护的。

3、大语言模型的关键是Scaling,这意味着任何单独被盗的内容都不足以支撑训练出一个大语言模型,这正是OpenAI模型为何领先。

也就是说,OpenAI本身都在违规使用《纽约时报》的数据训练闭源、商业化的大模型。现在他们要以违规为由,调查打造系列开源模型的DeepSeek。

再退一步,OpenAI如今的成就也是建立在谷歌的基础上(Transformer架构由谷歌提出),谷歌的成就是站立在更早期的学术研究基础上。

404 Media表示,这其实是人工智能领域发展的基本逻辑。

“DeepSeek模型只在成本上领先”

就在OpenAI挑起矛盾的同时,Anthropic也下场了。

创始人Dario Amodei在个人博客中表达了对DeepSeek的看法。

他表示并没有把DeepSeek看做是竞争对手,认为DS最新模型的水平和他们7-10个月前相当,只是成本大幅降低。

(Claude 3.5)Sonnet的训练是在9-12个月前进行的,而DeepSeek的模型于11月/12月进行了训练,而Sonnet在许多内部和外部Evals中仍然显着领先。

因此,我认为正确的说法是“DeepSeek生成了一种模型,用较低的成本(但没有宣传的那么低)实现了接近7至10个月以前的Claude的表现”。

同时他还认为,DeepSeek整个公司的成本投入(非单个模型训练成本)和Anthropic的AI实验室差不多。

奥特曼几乎保持了同样的口径。

他承认DeepSeek R1让人印象深刻(尤其是成本),但OpenAI“很明显会带来更好的模型”。

这也是他的常规操作了,之前V3发布时,他就阴阳怪气说:相对而言,复制确定有用的东西是很容易的。

那么DeepSeek R1的价值究竟几何?

分析师郭明錤最新博客给出参考:

DeepSeek R1的出现,让两个趋势更加值得关注——虽然没有R1这两个趋势也依然存在,但R1加速了它们的发生。

一是在Scaling Law放缓的情况下,AI算力仍可透过优化训练方式持续成长,并有利挖掘新应用。

过去1-2年,投资者对AI服务器供应链的投资逻辑,主要基于AI服务器的出货量在Scaling Law依然有效的情况下可持续增长。

但Scaling law的边际效益开始逐渐递减,市场开始关注以DeepSeek为代表的通过Scaling law以外的方式显著提升模型效益的路径。

第二个趋势是API/Token价格的显著下滑,有利于加速AI应用的多元化。

郭明錤认为,目前从生成式AI趋势中获利的方式,主要还是“卖铲子”和降低成本,而不是创造新业务或提升既有业务的附加值。

而DeepSeek-R1的定价策略,会带动生成式AI的整体使用成本下降,这有助于增加AI算力需求,并且可以降低投资人对AI投资能否获利的疑虑。

不过,使用量的提升程度能否抵消价格降低带来的影响,仍然有待观察。

同时,郭明錤表示,只有大量部署者才会遇到Scaling law边际效益的放缓,因此当边际效益再度加速时,英伟达将依然是赢家。

参考链接:

[1]

https://www.404media.co/openai-furious-deepseek-might-have-stolen-all-the-data-openai-stole-from-us/

[2]https://www.ft.com/content/a0dfedd1-5255-4fa9-8ccc-1fe01de87ea6

[3]https://x.com/GaryMarcus/status/1884601187271581941

twitter

[4]https://mingchikuo.craft.me/g8mybRumSTYD3J

s
sms1234
1 楼
这篇文章的作者竟然不是观察者网
五谷不分
2 楼
openai的数据爬虫疯狂在网上扒数据,经常把带宽不高的小网站直接给ddos干崩溃,居然还舔着脸说deepseek
g
googlebot
3 楼
openAI输了,
谈今论今
4 楼
老美已经快疯了!
龙起卷
5 楼
DS是把美国鼓吹的AI按在地上摩擦,对美国科技霸权造成挑战,中国6代机对美国军事霸权造成瓦解,目前美国只有金融霸权继续保持,但是要是科技霸权、军事覇权不存在金融霸权还存在吗?
先有09後有天
6 楼
还好意思叫openai
g
goodboy22
7 楼
美国是个大傻逼国家
按律当斩
8 楼
先容我笑一会儿哈哈哈哈哈哈。真是令人难以置信的讽刺啊,OpenAI一直以“未经授权的方式”获取大量数据,也违反了一些组织的条款规定,结果现在他们却在指责自己的做法。 OpenAI自己本身在合规性上也大有问题。 (众所周知)OpenAI训练模型把互联网上的数据扒了个干净,这其中除了免费公开的知识内容外,还包含大量有版权的文章作品。 2023年12月,《纽约时报》以侵犯知识产权为由,将微软OpenAI一起告上法庭。目前这个官司还没有最终判定结果,OpenAI这一年时间里就自己的行为向法院进行多次解释。
今日雨果
9 楼
. 🤔😂🤣😅好了,鸡血针打过了,狼癫疯也发过了,日子还是要过,回家好好过个年吧。 . 来看看某大学电脑科学系教授怎么讲的(机器译文): AI 既不是人工的也不是智能的。根据一些消息来源,它非常人性化,数量达到数百万。(*) 请参阅下面的帖子,了解其中一些人类如何找到彼此并团结起来。 . "团结起来变得更强大",而不是陈词滥调的"分而治之"。这就是方法。 . 有些人认为,主要是出于无知或缺乏知识,AI 是魔法,是两年前发明的,或者正在进行一场革命。好吧,很遗憾地告诉你,这些都不是真的。AI 自 1950 年代以来一直在流行,我们今天拥有的大多数基本算法都起源于几十年前。我们本质上拥有的是企业政变 (https://lnkd.in/ddMeqNDV)、大量炒作 (https://lnkd.in/dmE4DYC6)、到处赌博的大量资金(仅过去几天/几周就是一个例子),以及通常和永恒的承诺(当然,总是设定在未来)。 . 尽管过去 20 年该领域取得了长足进步,但人工智能还有很长的路要走。 . __ *:例如,请参阅 Kate Crawford 的书《人工智能地图集》https://lnkd.in/dQqDfuuX . .
爸爸老爹
10 楼
OpenAI在训练初期模型的时候大量盗用了未授权数据,狡辩称自己那时候还是非盈利开源项目,所以不需要付版权费。 , 反过来,OpenAI却禁止其他公司用GPT来训练自己的AI,哪怕是完全开源的DeepSeek也不行。 , 美国公司就是美国政府的缩影,没有道德,只讲利益。
s
snake1101
11 楼
e
eric703
12 楼
笑死,openai还说将提供比deepseek更好的模型,那能不能先提供个和deepseek一样好的但是更便宜的模型啊? 别总想着卖更好但是更贵的东西,有本事就卖一样好的但更便宜的。
d
dingding6
13 楼
横眉冷对千夫指,任凭风吹雨打,稳如泰山。
f
fengfengloup
14 楼
美国人不自信了。
小曉古今
15 楼
不是开源吗?抄不抄翻两瞪眼
千奇百怪党
16 楼
没理由都可以围剿,美国人需要理由吗?
这是神马情况
17 楼
哈哈,多么无力的辩驳,改变不了党国一贯支持“偷窃”的行为!怪不得以前说“闷声发大财”,都是些见不得光的勾当,现在竟然正大光明的出来炫耀,真是不以为耻,反以为荣!
g
goupeter
18 楼
看着白猪急得要跳墙就想笑
a
albertjia!
19 楼
API使用是要收费的,自己的游戏玩不下去就开始满地打滚撒泼吐口水?脸面这东西现在在大美丽是稀罕物了。
x
xxlm
20 楼
同道中人互相喷很没有职业道德哟。要不openai玩不起别玩了?
西
西林东渡
21 楼
共蛆网军冒充“外国网友”为中共丑闻辩护这一招早就用烂了。 华为的“遥遥领先”,DeepSeek的“横空出世”,还有缅甸妙瓦底十万人规模的中国诈骗特区等等,层出不穷的丑闻早已让中国臭遍全球。 中共把中国变成了一个厚颜无耻穷凶极恶,上上下下都在依靠坑蒙拐骗混事谋生的诈骗国。泱泱一大国盗贼和病人。 PRC=the People’s Republic of Cheat [1评]
v
visible
22 楼
小蝌蚪在蟾蜍井里替美国分忧,但似乎并不受人待见,等美国把台积电拿走,蟾蜍的井盖也就封严实了。 历史就此翻篇。毕竟连上餐桌当菜的资格都没有。就像量子涨落,毫无声息。
金山浪人
23 楼
真正的AI专家都心知肚明所谓的“蒸馏”只是在业界常用的“雕虫小技”,真正的AI专家都不屑拿出来谈论。以前AI大模型公司需要购买海量人工标注好的数据来训练,例如用1万张人工标注为狗的图片来训练大模型,然后用另外2千张标注为狗的图片来验证训练过的大模型来算准确率。所谓的“蒸馏”的方法是依靠已经训练好的AI大模型代替人工来“标注”图片用于训练、验证新的大模型,其好处是购买API的费用要远低于购买人工标注的数据,如果是自己的大模型就相当于免费。但是如果原始大模型有误判,那么新的大模型就会在错误的道路上一路狂奔得不偿失。所以一般业内一般会用“蒸馏”出来的数据做为验证之用,可以节省部分成本而已。哪怕DeepSeek“蒸馏”了OpenAI也是付了钱了,可以帮助OpenAI摊平购买原始数据的成本。其实OpenAI自己才是真正的恶劣,有内部“吹哨者”因为揭露OpenAI疯狂“白嫖”(蒸溜)出版社、网络作者的知识产权而“被消失”。
郑长仁
24 楼
但问题是,他妈是“青岛路虎婆”,他爸是“江西毛奇”,2024,敢动中国!
只想一个人
25 楼
这个吃相有些难看了
b
bigeyedog
26 楼
这帮傻逼,deepseek的价值就在于证明美国AI是个大泡沫,现在泡泡刺破了,再怎么狡辩也没用
t
taigang
27 楼
你一天到晚逼叨你这两个亲戚,烦不烦?