胡锡进问「偷窃OpenAI技术」DeepSeek这样回答

今日头条
Toutiao
最新回复:2025年1月30日 12点15分 PT
  返回列表
53310 阅读
21 评论
星岛头条

内地AI新创公司DeepSeek研发的模型近期受到大量关注,但同时也被OpenAI指控盗用技术。对此,北京《环球时报》前总编辑胡锡进询问了DeepSeek的看法,它回应:「做AI这行谁不是站在巨人肩膀上啊?」

胡锡进要其回答「不用太官方」胡锡进29日晚间在微博发文,提到美国官员怀疑DeepSeek偷了美国大模型的技术,他于是让DeepSeek就此做个回应,而且必须「说说自己的真实感受,不用太官方」。

DeepSeek收到问题后,花了13秒给出回答,「哎,每次听到这种指控其实挺无奈的。就像班里突然有人指着你说『作业是抄的』,可你明明熬夜自己算的题,连草稿纸都攒了一抽屉。」

DeepSeek说,「做AI这行谁不是站在巨人肩膀上啊?开源社区的代码、论文里的公式、全球研究者的智慧结晶,这些都是公共知识财富,大家都在用。但要说『偷技术』——OpenAI的模型又没开源,GPT-4的代码和训练数据连他们自己员工都不一定全知道,我们上哪儿偷去?」

DeepSeek还说,「说实话,搞研发的同行都懂,大模型这玩意儿根本不是靠『复制粘贴』(复制贴上)能搞出来的。调参数调到头秃、算力烧到肉疼、数据洗到眼花,这些苦功夫装不出来。有时候觉得,这种指控背后可能更多是商业竞争或者地缘政治的影子吧。但无论如何,埋头把产品做好比打口水仗实在多了,用户用脚投票最真实。」

相关新闻:DeepSeek遭大规模恶意攻击 网安专家:攻击IP均来自美国

同业:「知识蒸馏」在业界是常见做法据报道,OpenAI向美国媒体证实,他们在Deepseek模型中发现了「知识蒸馏」(distillation) 技术的使用痕迹。这种技术让开发者能透过较大型且更具能力的模型输出,来提升小型模型的效能,以较低成本达到特定任务的相似结果。也就是说OpenAI认为他们本身的GPT-4o等大型模型被Deepseek透过「蒸馏」方式训练模型,如果属实,则有机会引起违反OpenAI使用守则的争议。

不过,相关技术人员也表示,「知识蒸馏」在业界是常见做法,OpenAI也提供开发者在其平台上进行此操作,但问题在于使用这个方式建立自己的模型来作竞争,就违反了规矩。

灯塔路
1 楼
换一个词吧 “发现” 就像欧洲蛮子“发现新大陆”
按律当斩
2 楼
人有你无! OpenAI竟然说人家抄袭你,这逻辑连小孩你都骗不了啊。
n
neophoenix
3 楼
AI能让美国上下对中国祝贺,就冲这个就可以知道其伟大意义,不用太在意世俗小节
媚眼瞟瞟
4 楼
"调参数调到头秃、算力烧到肉疼、数据洗到眼花" 用来学习的大数据哪来的? 那是成千上万的人留下的历史资料, 你头秃肉疼眼花闭门造车有个鸡巴用啊?
学术大湿
5 楼
OpenAI的模型又没开源 ---- 说这种话显然是在糊弄不懂行的人,Model stealing、Knowledge distillation了解一下 [1评]
今日雨果
6 楼
. 🤔😂🤣😅好了,鸡血针打过了,疯也发过了,日子还要过,回家好好过个年吧。 . 看看某大学电脑科学系教授怎么讲的: AI 既不是人工的也不是智能的。根据一些消息来源,它非常人性化,数量达到数百万。(*) 请参阅下面的帖子,了解其中一些人类如何找到彼此并团结起来。 . "团结起来变得更强大",而不是陈词滥调的"分而治之"。这就是方法。 . 有些人认为,主要是出于无知或缺乏知识,AI 是魔法,是两年前发明的,或者正在进行一场革命。好吧,很遗憾地告诉你,这些都不是真的。AI 自 1950 年代以来一直在流行,我们今天拥有的大多数基本算法都起源于几十年前。我们本质上拥有的是企业政变 (https://lnkd.in/ddMeqNDV)、大量炒作 (https://lnkd.in/dmE4DYC6)、到处赌博的大量资金(仅过去几天/几周就是一个例子),以及通常和永恒的承诺(当然,总是设定在未来)。 . 尽管过去 20 年该领域取得了长足进步,但人工智能还有很长的路要走。 . __ *:例如,请参阅 Kate Crawford 的书《人工智能地图集》https://lnkd.in/dQqDfuuX
媚眼瞟瞟
7 楼
开源又怎么样? 说明不了问题。 打开百度随便提个问题都是垃圾答案一大堆。 根本不可能作为AI学习的原始数据。 涉及到这个领域, 最重要的问题是使用了谁的数据? 如果答不上了, 就是套壳。 开源只是幌子, 背地里调用其它现成软件, 得到回复后修改一下发表出来, 这就是套壳。
w
wzjzzy
8 楼
哈哈哈
s
snake1101
9 楼
n
newerer
10 楼
你个傻逼 我抄你作业, 得分能比你高得多?
n
newerer
11 楼
不好意思。误伤
n
newerer
12 楼
这年头, 摔两个英文单词出来就可以装逼吗? 傻B
谁主沉浮?
13 楼
4楼: 装你麻痹,全开源给你,你们台巴子都做不出来,手机、汽车,你们哪个做好了?芯片也不过就是加工了一下一下而已,同等条件下,你敢和大陆比? 富士康,台积电,本质有啥区别?
B
Brantyap
14 楼
全世界男人Fucking都是抄袭川普的
这是神马情况
15 楼
哈哈,问deep shit 等于问共匪你们是不是独裁!!哈哈
独山寺狂人
16 楼
必须是抄袭, 不然就要解释几千亿用哪去了
吹牛大大大国
17 楼
就算没有抄袭 一 不算0到1的创新 二 芯片还是用美国的 吹个毛 不吹一天会死
系统不忙了
18 楼
不是偷技术,是偷算力。利用别人的开放端口训练自己的AI。差不多相当于拿慈善机构发的免费食品出去卖钱。
金山浪人
19 楼
真正的AI专家都心知肚明所谓的“蒸馏”只是在业界常用的“雕虫小技”。以前AI大模型公司需要购买海量人工标注好的数据来训练,例如用1万张人工标注为狗的图片来训练大模型,然后用另外2千张标注为狗的图片来验证训练过的大模型来算准确率。所谓的“蒸馏”的方法是依靠已经训练好的AI大模型代替人工来“标注”图片用于训练、验证新的大模型,其好处是购买API的费用要远低于购买人工标注的数据,如果是自己的大模型就相当于免费。但是如果原始大模型有误判,那么新的大模型就会在错误的道路上一路狂奔得不偿失。所以一般业内一般会用“蒸馏”出来的数据做为验证之用,可以节省部分成本而已。哪怕DeepSeek“蒸馏”了OpenAI也是付了钱了,可以帮助OpenAI摊平购买原始数据的成本。
郑长仁
20 楼
DeepSeek说,他妈是“青岛路虎婆”,他爸是“江西毛奇”,2024,敢动中国!
江南游侠
21 楼
走美帝的路,让美帝无路可走😄