DeekSeek靠“蒸馏”火出圈:到底是创新还是剽窃?

今日头条
Toutiao
最新回复:2025年1月31日 18点20分 PT
  返回列表
48558 阅读
80 评论
自由亚洲

中国新创公司深度求索(DeepSeek)研发的DeepSeek大型语言模型最近“出圈”爆火。 (Florence Lo/路透社)

中国新创公司深度求索(DeepSeek)研发的DeepSeek大型语言模型最近“出圈”爆火。不过有评论指出,DeepSeek是依靠 “蒸馏” OpenAI 模型的数据来帮助开发自家技术。这其中是否涉及窃取或者抄袭?中国的AI产业是否真的实现了“ 弯道大超车”,还是靠宣传自嗨了一把?以下请听本台记者凯迪的报道。

本周,科技和外交政策圈都在关注一则消息,即中国开源推理大型语言模型DeepSeek-R1 被发现在多项核心任务测试中的表现与 OpenAI 的模型相当,而其开发成本仅为560 万美元,不到竞争对手的十分之一,并且使用的是英伟达相对低端的H800芯片。

依靠 “蒸馏”开发自家技术?

不过,美国总统特朗普的人工智能沙皇萨克斯1月28日对美国福克斯新闻(Fox News)表示,DeepSeek使用了一种名为“蒸馏”的人工智能训练方法,即一个新的人工智能模型透过向一个现有模型提出数百万个问题,从中吸取其知识及模仿其推理过程。

当被问及 DeepSeek 是否窃取了美国的知识产权时,萨克斯说这是“可能的”。他指出:“有充分的证据表明,DeepSeek在这里所做的就是从OpenAI的模型中提取知识,我认为OpenAI对此不太高兴。” 他认为,美国的人工智能公司将采取措施,以保护他们的模型不被“蒸馏”,而这肯定会减缓山寨模型的发展速度。

美国《华尔街日报》报道指出,“蒸馏”技术已经被人工智能开发者使用多年,但从未取得像DeepSeek这样的成功。测试显示,DeepSeek创建的模型与OpenAI和谷歌的模型得分几乎一样高,而成本却远比竞争对手低。

窃取技术还是创新?

DeepSeek真的是靠“蒸馏” OpenAI 的数据来实现“弯道超车”的吗?据美国彭博社周二(28日)引述知情人士报道,OpenAI和微软正在调查DeepSeek 是否以未经授权的方式, 获取了源自OpenAI技术的数据输出。去年秋季, 微软的安全研究人员观察到可能与DeepSeek有关联的个人,使用OpenAI应用程序编程接口(API)窃取了大量数据。

OpenAI 还对英国《金融时报》表示,他们已经看到了“蒸馏”的证据,尽管他们并未公开这些证据。

据日本媒体《日经亚洲》周四(30日)报道,蒸馏并非新技术,也不一定都具有争议性。自 2024 年以来,随着企业对于使用大型语言模型 (LLM) 的需求增加,蒸馏变得越来越受欢迎。日本一家 AI 初创公司的工程师表示,大型语言模型难以处理,这需要大量昂贵的图形处理单元 (GPU)。而蒸馏可大大缩短开发时间与成本,开发出比大型模型运行速度更快的模型。

报道指出,DeepSeek 的问题在于其低成本模型是否“更多地基于蒸馏而不是创新”。对此,Astris Advisory Japan 分析师 Kirk Boodry 说:“他们是否能够使用现有的大型语言模型来提炼他们的结果是一个问题。这似乎在讨论中出现了很多次。人们说,‘我不知道这其中有多少是真正前沿的。’”

Omdia 咨询总监 Kazuhiro Sugiyama 则指出,DeepSeek的影响只是“暂时且有限的”,业界仍需验证其持久性。分析师也怀疑DeepSeek的开发预算是否真的那么小。Boodry 说,当人们谈论 DeepSeek的开发时间和费用时,他们谈论的是这个非常具体的模型:“人们随意给出的数字可能太低了。”



有评论指DeepSeek是依靠 “蒸馏” OpenAI 模型的数据来帮助开发自家技术。 (Dado Ruvic/路透社)

不过,美国信息技术与创新基金会的人工智能问题专家霍丹·奥马尔(Hodan Omarr)以书面方式告诉自由亚洲电台,DeepSeek 的确取得了一些值得认可的创新成就:“DeepSeek 的效率和性能源自多项创新的结合。其关键策略之一是混合专家 (MoE),即通过允许模型的不同部分专注于特定任务来降低训练成本。它还应用数据量化来显著缩小 AI参数,同时保持准确性。为了优化硬件性能,DeepSeek 将 GPU 工作负载划分到多个处理器上以加快计算速度,并采用 CPU 协调技术来高效管理大数据流。”

展望未来,《日经亚洲》引用专家Sugiyama的预测说,人工智能模型未来将逐渐“两极分化”,微软和谷歌等大公司将继续投资于更大、更强的模型用于其服务,而较小的公司则开发更小、更便宜而高效的模型,以适合有针对性市场。 另一位人工智能工程师也表示,缩小人工智能模型的规模是个大趋势:“随着时间的推移,将会有很多方法来实现这一点。”

DeepSeek实现“弯道超车”是媒体炒作?

过去一周,DeepSeek的出现被形容为中国向硅谷投下的一枚震撼弹,令美国在人工智能领域的主导地位受到空前质疑。投资者一度抛售了一万亿美元的科技股,纳斯达克指数一度下跌超过3%。同时,在中国社交媒体上,DeepSeek引发热议,被视为中国AI能力超越美国的证据,之前美国遏制中国半导体与AI硬件设备的努力似乎付之东流。

其实,中国媒体去年就曾关注到DeepSeek以超低成本开发大型语言模型DeepSeek V2,并说“今天开始,GPT4级大模型进入白菜价时代”。

去年7月, DeepSeek创建人梁文锋在接受中国科技新闻门户网站36氪采访时,对于为何DeepSeek V2会让硅谷的很多人惊讶的问题回应说:“他们之所以惊讶,是因为这是一个中国公司,在以创新贡献者的身份,加入到他们游戏里去。毕竟大部分中国公司习惯follow(跟着走),而不是创新。”

他谈到,中国和美国在AI领域“真实的gap(差距)是原创和模仿之差”。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。他还指出,英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。中国必然需要有人站到技术的前沿。

DeepSeek真的已经“弯道超车”、站到技术的前沿了吗?据全国广播公司商业频道(CNBC) 报道,微软CEO萨蒂亚.纳德拉日前在瑞士达沃斯世界经济论坛上表示:“看到DeepSeek的新模型,真的令人印象非常深刻。他们切实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高……我们必须非常、非常认真地对待中国的这些进展。”

不过,美国国防科技公司Anduril Industries创办人拉奇(Palmer Luckey)29日在福克斯财经(FOX Business)节目专访中指出,媒体铺天盖地引述DeepSeek说法,称其如何以超低成本训练出一个可与美国数十亿美元开发的聊天机器人匹敌的AI模型。但这些消息的炒作成分居多,外界不必过度相信,也不要“上了中共宣传的当”。

拉奇指出,DeepSeek并未完整公布他们开发两种模型的成本,媒体也忽略了DeepSeek仍有很大部分的基础设施成本不为人知。他表示:“症结在于,他们公布这个数字的目的,就是为了重挫美国公司。”

据最新消息,DeepSeek 应用已从意大利的谷歌和苹果 App 商店中下架。虽然官方未解释确切原因,但路透社等媒体注意到,意大利隐私监管机构 Garante 此前对 DeepSeek 提出的数据存储地点及隐私问题。白宫新闻秘书日前也提到,官员们正在调查该应用程序对国家安全的影响。

截至发稿,DeepSeek尚未回复本台相关置评请求。

T
TitaniumAtlas
1 楼
参加展览会把人家的设计抄过来改进一下就宣传是自己的知识产权了,这就是弯道超车的本质。
a
ajaychen_2024
2 楼
OpenAI是一家米其林三星餐厅,他们的招牌菜是一道超级复杂超贵的“AI炖肉”。现在,DeepSeek被指控“偷了他们的炖肉配方”。 DS确实也做炖肉,但DS的配方是自己研究的。DS用的是公开的食谱书(公开数据集),还加了自己的秘制调料(创新技术)。DS没进过OPEN AI的厨房,也没偷OPEN AI的锅(专有模型)。DS的炖肉可能味道有点像,但那是因为DS都用了猪肉(公开技术),而不是因为DS抄了OPEN AI的做法。再说了,DS的炖肉更便宜、更快上桌(高效推理),还特别适合爱吃辣的人(特定领域优化)。
a
ajaychen_2024
3 楼
不要忘记,OPEN AI 是闭源的,而 DS 是开源的,不仅仅是公开代码,它还涉及数据、模型、工具以及整个开发流程的透明性和可访问性
注册怎么这么难
4 楼
按照粉红们历来的逻辑,答案如下: 如果DeekSeek是中国公司 - ‘蒸馏’就是创新 如果DeekSeek是美国公司 - ‘蒸馏’就是剽窃
H
HALS
5 楼
美国公司早就知道蒸馏,并明文警告。DS还要蒸馏。既无重新,还违法。
侠士控
6 楼
档妈的几大新发明:百度、淘宝、电动汽车、高速铁轨
k
kl3527
7 楼
洗地还是应该专业一点。DS虽然是“开源”的,也不是它把内裤都脱了让你看到一切。搞清楚开源究竟“开”了什么再来找洗地的角度
T
TXZS
8 楼
who cares! 世界人民喜欢就行!
k
kl3527
9 楼
蒸馏是一个早已有的方式,大家也知道它的很多弊病,所以都在小心翼翼的摸索。DS就像那个搞婴儿基因编辑的家伙一样,为了出成果,为了加速什么伦理道德潜在的问题都不顾,根本不是做AGI应该有的态度。
绝望小狗
10 楼
openAI的剽窃还在打官司,自己屁股都没擦干净还好意思说别人剽窃?西方偷就叫共享,是么?
注册怎么这么难
11 楼
ajaychen_2024 发表评论于 2025-01-30 13:41:48 不要忘记,OPEN AI 是闭源的,而 DS 是开源的,不仅仅是公开代码,它还涉及数据、模型、工具以及整个开发流程的透明性和可访问性 ----------------------------------------------- 拿别人的东西来用还这么理直气壮? DeepSeek是使用OpenAI专有模型来训练自己的模型,但OpenAI在产品使用条款中明确规定用户不能“复制”其任何服务或“使用其输出开发与OpenAI竞争的模型”,恰恰DeepSeek和ChatGPT属于同类竞争产品。 别那么不要脸、如果两个角色完全颠倒过来你肯定就不这么说了
t
true?
12 楼
在牛顿三定律的基础上继续研究就是蒸馏就是剽窃。
注册怎么这么难
13 楼
绝望小狗 发表评论于 2025-01-30 13:56:00 openAI的剽窃还在打官司,自己屁股都没擦干净还好意思说别人剽窃?西方偷就叫共享,是么? ------------------------------------------------- openAI知道剽窃这事丢人还知道擦干净,DeekSeek连装都不装、赤裸裸地全世界宣告 - “我就是个贼”
京城老炮1950
14 楼
不要忘记,2年以前先有OpenAI而且是闭源的。DS无论开源或者闭源,2年以后的今天才有DS。时间回放,是先有的Yahoo?还是先有的新浪?是先有的Google?还是先有的百度?是先有的亚马逊?还是先有的阿里巴巴?不用再罗列下去了吧......至于DS到底是创新还是剽窃?过不了多久,真相就会大白。我们拭目以待。 ======================== ajaychen_2024 发表评论于 2025-01-30 13:41:48 不要忘记,OPEN AI 是闭源的,而 DS 是开源的,不仅仅是公开代码,它还涉及数据、模型、工具以及整个开发流程的透明性和可访问性。
S
Simiguy
15 楼
从人类发展的角度,这种"偷"值得提倡。 DS不可能什么都从头开始,open Al其实也不是从头开始。都是站在人类现有知识集基础之上的。至于楼下说的展会设计,你既然已经公开,就允许别人借鉴。天下所有车都是4个轮子,你不能说都是抄袭吧。
左岸右岸
16 楼
现在竟然给偷窃起了这么些好听的名字。但都改不了剽窃他国研究成果的事实。还全球高调宣布,真是脸都不要了!
T
TitaniumAtlas
17 楼
这个从来没有过知识产权。做贼被抓了,然后指控大家都是贼,凭什么抓我 ”true? 发表评论于 2025-01-30 14:02:37 在牛顿三定律的基础上继续研究就是蒸馏就是剽窃。
w
wumiao
18 楼
彭博社消息,微软安全研究人员去年秋季就观察到与深度求索有关联的个人,使用了openAI应用程序编程接口(API)窃取了大量数据。作为OPenAI合作伙伴和最大投资者的微软,一将盗窃事件通知OPenAI。同时,OPenAI已经通过金融时报,指控深度求索的盗窃行为。 胡锡进发了个文为这个抄袭者辩护,最终的意思就是孔乙己的“窃书不能算偷”。说既然是科学技术革命,那就是全世界的财富,都可以从中捞一杯羹。
a
ajaychen_2024
19 楼
西方有一个“吹捧”中国逆向工程师的笑话,说不能在展览会让中国工程师看见触摸展品甚至看产品单张说明书,因为他们有“看一眼就能怀孕”的本事。如果DS的工程师有看一眼就“怀孕”的能力,那就是他们的真本事。 TitaniumAtlas 发表评论于 2025-01-30 13:33:41参加展览会把人家的设计抄过来改进一下就宣传是自己的知识产权了,这就是弯道超车的本质。
t
tudoutudou99
20 楼
偷窃创新也是创新,违法又怎么了?我就在国内使用,看美帝怎么制裁
硅谷工匠
21 楼
谷歌傻了,原来所有搜索都应该收费
A
Andywood
22 楼
有谁知道OpenAi用来训练的原始数据是从哪里买的?
E
Etornado
23 楼
很多捍卫DeepSeek的人真的很蠢,说OpenAI也是从Internet收集data,为什么DeepSeek就不能拿OpenAI训练好的data?通常我不想回答蠢问题,但这次破例: 就拿那张钓鱼图说事,鱼在大海里属于大众资源(就如Internet上大家互相公开的资讯,没人反对吧?),从大海钓到的鱼,放入自己的桶内就成为私有财产(没人反对吧?)。现在有人趁我不注意,从我桶里捞鱼走,算不算盗窃?! 再举一个例子,钞票在社会上流通,属于人类社会资源(没人反对吧?),我凭本事在社会里赚到钞票放入自己钱包就是我的个人财产(没人反对吧?)。现在有人趁我不注意,从我钱包把钞票抽走,还说“钞票是社会资源,凭什么说一定属于你的?” 大家现在明白了没?!
橡皮潜艇
24 楼
性ajaychen_2024 发表评论于 2025-01-30 13:36:51 OpenAI是一家米其林三星餐厅,他们的招牌菜是一道超级复杂超贵的“AI炖肉”。现在,DeepSeek被指控“偷了他们的炖肉配方”。 DS的炖肉更便宜、更快上桌(高效推理),还特别适合爱吃辣的人(特定领域优化)。 …… 用别人的高汤煮自己的肉也叫“创新”还有什么不是
a
ajaychen_2024
25 楼
问题是OPEN AI也曾经开源过,数据也曾经是公开的。我学着MASTER chief 的公开发售的菜谱和YT视屏做的菜,然后拿去开饭店,你可以告我剽窃吗? TitaniumAtlas 发表评论于 2025-01-30 14:15:04这个从来没有过知识产权。做贼被抓了,然后指控大家都是贼,凭什么抓我
橡皮潜艇
26 楼
怎么觉得陈阿痂就是八戒/相信吃屎?搞这么多马甲就为了洗地
E
Etornado
27 楼
用别人的高汤煮自己的肉也叫“创新”还有什么不是 --> 您错了!他们是偷偷取走人家提供试吃的炖肉,换了个碟子再拿出来卖,就说是自己餐馆的招牌菜。
r
rayofday
28 楼
这是另一赛道的“仿制药”。 不过仿制药和中成药垄断集采, 已经被天朝百姓万人唾骂; AI赛道的“仿制药”DeepShit因为不明显触及百姓利益, 最近在网上差不多被捧上天了; 同时花姐拿它当棋子洗盘收割散户, 也被粉红们当成“仿制药”强大的证据。 再看看吧, 这瓜稍微有点大, 涉及的方方面面也挺多。
橡皮潜艇
29 楼
不过DS还是有利于制止openai那帮人漫天要价普通用户买单
橡皮潜艇
30 楼
川普说“AI”要回归经济规律,这个要挺
四月如风
31 楼
中共有本事自己弄出一个全新的车西,别老跟着人家屁股后面。美国花大功夫搞出来了他们弯道超车。世界上没有第二个国家如中共般无耻,抄袭偷窃简真就刻到他们骨子里。
白云蓝天
32 楼
"即一个新的人工智能模型透过向一个现有模型提出数百万个问题,从中吸取其知识及模仿其推理过程。"——本人感觉靠这个是远远不够的。 而且通过这种笨办法(因为过程很繁杂,而结果很差)来建立一个新模型,还不如通过破解已有的人工智能的技术来建立一个新模型。
W
Wuweixiao
33 楼
一团浆糊,有时说窍取,有时说他们其实不便宜,其实慌的一比
白云蓝天
34 楼
本人觉得 DeekSeek 的技术很大概率是中国自创的。在软件开发方面,中国的技术在很多方面不比美国差,而且关键是只要搞到顶尖水平的技术人员,就能做到。美国技术人员能够创造一种软件技术,难道中国技术人员连仿制的水平也没有?!关键是中国极有可能在两个方面说谎,一个大大的说低了成本,二是隐瞒硬件技术,即通过获得美国禁止出口中国的硬件才能够创建出DeekSeek。
a
ajaychen_2024
35 楼
看事情看两面,来看看当事人之一微软的COPILOT怎么说的: COPILOT-- 关于DeepSeek被指控偷窃模型训练数据的问题,有一些讨论和分析。 从技术角度来看,DeepSeek V3模型被指存在训练数据抄袭的问题,产生了奇怪的“幻觉”,例如自称是“GPT-4”,甚至连所讲的笑话都与GPT-4高度雷同12。这种现象可能是由于训练数据中混入了大量来自某个特定模型(例如GPT-4)的输出内容,导致新模型学习到了该模型的“说话方式”甚至“思维模式”,从而在特定情况下表现出与该模型类似的特征1。 此外,这个问题也引发了关于AI内容版权的讨论。现有的版权法难以完全适用于AI生成的内容,其“独创性”在法律上仍存争议,传统内容创造者的利益也会受到影响1。例如,《纽约时报》起诉OpenAI和微软等诉讼反映了这种焦虑1。 总的来说,DeepSeek的情况并非个例,其他大模型如Google的Gemini也曾出现过类似问题1。未来如何更好地对AI内容进行版权确定和使用,是一个需要解决的行业问题。
橡皮潜艇
36 楼
离开open Ai,搞不到训练资料,DS就什么也不是。什么时候中国人可以独立生活?
L
Lira
37 楼
既然“开源”了,不就是随便别人使用吗?要不然,就用IP保护起来。 想起以前的大妓院,因为写着免费,被人多拿(不管有意无意),不高兴了,告到法院,结果人家法官说免费的东西,不能限制人拿。
老歌好听
38 楼
给你科普一下,第一,开源指的是算法的一部分,不含数据。用来训练的数据时AI的基础,不花时间和金钱是得不到的。DS偷的就是用美国公司根据数据训练而得到的结果,用来再次当作数据,因而被称作蒸馏,象从米酒提炼白酒一样。第二,Deepseek用从美国买来的几个大模型的API提取数据,用来开发竞争产品,这是直接违反合同的。所以说DS就是一个货真价实的山寨品 ======================================] Lira 发表评论于 2025-01-30 15:24:55既然“开源”了,不就是随便别人使用吗
文学城普通人
39 楼
偷摸蒸馏是大家都用到一些,但是以大规模蒸馏作为手段也是绝少的,大规模蒸馏完了还要出来卖弄如何领先和成本优势,那是仅此一家了。再加上资本集团的操控市场得利,愚蠢媒体被利用,AI大拿为开源背书的狂热,所以就有了黑色星期一
r
rayofday
40 楼
DS如果纯粹是一家民间企业参与AI生态降低研发使用成本那我是拥护的。 但是它不是, 最近的DS episode参与了太多利益色彩。 DS的模型已经发布有一段时间了, 有反响但不轰动。 但是前一阵子幻方和DS高层频频与国务院和相关领导机构互动, 就是要设局在媒体及各社区自媒体的配合下在新年前发布最新产品造成轰动效应,用粉红的话说就是在AI领域对漂亮国发达科技反击,证明厉害锅在科技领域的领先地位和掀起一波新的爱国主义热潮, 让漂亮国放弃对厉害锅的科技封锁。 同时幻方作为量化机构非常熟悉花姐运作机制, 在NASDAQ高位横盘时事先做空美股然后放出利空, 配合在美国各种媒体及网络媒体的造势, 打出这一发让花姐非常高兴的子弹, 造成NVDA及整个科技股大盘恐慌性砸盘, 收割不明就里的机构和散户。 这一波幻方/DS在股市收获巨大, 以致他们根本不需要在AI市场创收。被收割的也有不少逃离大A到美股讨生的天朝股民。这一波政治和金融层面的操作都非常高明, 也非常邪恶????。
a
ajaychen_2024
41 楼
DEEPSEEK V1早在11月份发布,V3在12月份就发布了,微软所说的“剽窃”只能是在之前的一段内事件发生因为训练模型需要时间,为什么那时不告,早不报告晚不报告,偏偏要等到股市大跳水之后微软才跳出来说。明显是因为华尔街资本大佬们十分不满,要撤资,微软才跳出来为自己的AI高费低能辩护甩锅,“都是他们DS偷的!老板不要撤资啊”
点点点点点
42 楼
abibas有没有商标侵权adidas?这个问题的答案就能区分一个人是野蛮还是文明。 这里同理
点点点点点
43 楼
文明千万不要和野蛮争论,不在一个认知水平上
橡皮潜艇
44 楼
还是要支持DS打压chatgpt的卖价。卷了我多少钱!
P
Panda44
45 楼
那OpenAI自己不可以“蒸馏”吗?DeepSeek还是独创了算法的!
w
wanjiadeng
46 楼
回复:‘ajaychen_2024 发表评论于 2025-01-30 13:41:48 不要忘记,OPEN AI 是闭源的,而 DS 是开源的,不仅仅是公开代码,它还涉及数据、模型、工具以及整个开发流程的透明性和可访问性’ **================** Open AI 从ChatGPT4才开始闭源的。那之前都是开源的。另外很多中国的AI模型都是基于Meta的LLaMa开源模型的
逆向操作
47 楼
这些质疑都出自台湾的1450
P
Panda-2020
48 楼
美国公司正在蒸馏DeekSeek open source
杰瑞王
49 楼
怎回事儿?懂的都懂,不懂的在装傻; 盛宴变闹剧
a
ajaychen_2024
50 楼
祸根是那5000亿美元的“星际之门”
T
TitaniumAtlas
51 楼
拿笑话来论证也是醉了,ds那是看一眼的事情?偷窃人家的知识产权都实锤了。 ajaychen_2024 发表评论于 2025-01-30 14:22:07 西方有一个“吹捧”中国逆向工程师的笑话,说不能在展览会让中国工程师看见触摸展品甚至看产品单张说明书,因为他们有“看一眼就能怀孕”的本事。如果DS的工程师有看一眼就“怀孕”的能力,那就是他们的真本事。
弯刀月
52 楼
这个话题,我是法盲加科盲。你们随便吵,我歇会
C
Capitaltwo
53 楼
为了不让竞争对手对手难堪和留有余地(到底还是两岸一家亲),ds没有说他们用的都是国产gpu芯片做的系统,总共花了560万人民币成本。
雾蒙蒙雨霏霏
54 楼
酸葡萄,DS收费是OpenAI的20分之一,DS怎么去操作? 最好的策略是奋起直追,而不是做 crying baby。
a
ajaychen_2024
55 楼
“实锤”?还是那句,请拿出证据。 TitaniumAtlas 发表评论于 2025-01-30 16:21:28拿笑话来论证也是醉了,ds那是看一眼的事情?偷窃人家的知识产权都实锤了。
蓝天大地
56 楼
这个毛毛没有听说过商业协议。他认为所有的合同都是历史文件。 啊哈哈哈哈哈哈哈 ------------------------------------------------ Simiguy 发表评论于 2025-01-30 14:10:00从人类发展的角度,这种"偷"值得提倡。 DS不可能什么都从头开始,open Al其实也不是从头开始。都是站在人类现有知识集基础之上的。至于楼下说的展会设计,你既然已经公开,就允许别人借鉴。天下所有车都是4个轮子,你不能说都是抄袭吧。
我要真普選
57 楼
站在巨人的肩膊上吹牛B ,看誰比我高?
蓝天大地
58 楼
+100000 ------------------------------------------------------- Etornado 发表评论于 2025-01-30 14:39:12
老街口瓜子
59 楼
让美国蒸发上万亿,几个星际之门没了,这还了得,网络攻击,诬陷,造谣一起来,反华媒体更是上窜下跳
我要真普選
60 楼
今天說說斯大林時代風靡一時的蘇聯神話——勞模礦工斯達漢諾夫故事。舉一反三,由點及面,由面及裏,分析眼前的事物是否是謊言?會不會也很扯? 蘇聯時期《真理報》宣傳消息,礦工斯達漢諾夫6小時開採了102噸煤,一個人幹了煤礦日產量的10%,超過了普通定額的13倍。 但當時,蘇聯採煤技術很落後,一個礦工既要採煤,又要經常放下采煤的風鎬去清理和加固工作面,清理和加固完畢後,繼續拿起風鎬採煤,如此循環往復,效率很低。 不過斯達漢諾夫什麼都不用管,只負責用風鎬採煤,一路向前推進。斯達漢諾夫連續工作了5個小時45分鐘,中間沒有停歇,一口氣開採了超過100噸煤。 第二天早上,高度評價了斯達漢諾夫的成績,盛讚他創造了極具政治意義的世界紀錄,是落實斯大林同志關於領導幹部無條件提前完成年度計劃指示的最佳方法。 事蹟很快傳到了領導的耳朵裏,就囑咐過下面,要求在工人階級中尋找突出人物,樹立典型,製造英雄,振奮並鼓舞蘇聯人民,爲社會主義建設注入強大的精神力量。 最重要的一點——礦黨委全體會議警告所有人,那些懷疑、污衊、抹黑斯達漢諾夫同志事蹟的人,是反對我們國家最優秀人物的最兇惡、最卑鄙的敵人。敵人,當然得用鐵拳錘死。誰還敢多嘴?
京城老炮1950
61 楼
IBM大型计算机是在1984年进入中国的,当时的科学院计算所和各大专院校的计算机科学精英们都想搞一套像IBM大型机操作系统VSE和MVS一样的中国式的自己的大型机操作系统用于中国的各大商业银行。到目前为止搞出来了吗? 科学院计算所什么时候成立的?里面有多少人是留苏,留美和留洋的?同样科学院半导体研究所是什么时候成立的?里面有多少人是留苏,留美和留洋的?当年科学院半导体研究所成立的时候台积电在哪儿呢?台积电的张忠谋又在哪儿呢?64年过去了,64年不短啊!为什么一块小小的芯片还受制于西方的制裁?还要看人家的脸色过日子呢? ================================ 白云蓝天 发表评论于 2025-01-30 15:20:32 本人觉得 DeekSeek 的技术很大概率是中国自创的。在软件开发方面,中国的技术在很多方面不比美国差,而且关键是只要搞到顶尖水平的技术人员,就能做到。美国技术人员能够创造一种软件技术,难道中国技术人员连仿制的水平也没有?!
逆向操作
62 楼
一看出自“自由亚洲”就知道是FAKE NEWS。 看看需要真金白银才能购买的AI 晶片制造商怎么说。 AI chipmaker Cerebras says it’s been ‘crushed with demand’ for China’s DeepSeek from business customers
w
watcher2
63 楼
就算真的靠蒸馏,知不知道那会使成本降低多少?能有1%就不错了。
n
not4any
64 楼
想起了一位诚实的美国游泳选手在奥运比赛后怼了本国媒体的一句话,”不能游不过人家,就说人家吃药了。“
T
TitaniumAtlas
65 楼
楼下完全不懂嘛,前面那部分得处理海量无格式的可能是错误的信息,最烧钱的
橡皮潜艇
66 楼
归根到底还得靠别人。现在IP被人封锁,“蒸馏”没有来源了,还怎么玩?
l
ljcn
67 楼
一个出骗子/电诈的国家,DS什么操行,你们心里没点b数?
金玉屋
68 楼
发明轮子和用轮子做交通工具的区别的确是很大的。
白云蓝天
69 楼
京城老炮1950 发表评论于 2025-01-30 17:12:54 IBM大型计算机是在1984年进入中国的,当时的科学院计算所和各大专院校的计算机科学精英们都想搞一套像IBM大型机操作系统VSE和MVS一样的中国式的自己的大型机操作系统用于中国的各大商业银行。到目前为止搞出来了吗? --------------------- 拿几十年的过去和现在比?!现在中国高新技术领头人很多都是在美国搞过很多年。虽然中国总体还不能可美国比,但在某些领域完全可以赶上。我下面已经说了,在软件方面,只要搞到顶尖人才,而又没受到硬件的限制,有些方面完全可以搞成世界一流。
想不开1
70 楼
借腹生子没有什么大的问题,但是说成是全程自我生子,就有点过了。
t
truth_hurts
71 楼
这就如同要准备托福亚斯考试就拼命刷真题一样,非常有效,但英语水平提高不大。
r
randomspot
72 楼
是不是创新, 然后谁抄谁, 下一个季度就见分晓 几个月后看看美国大厂的大模型是否训练成本都大幅度下降就知道了。
硅谷工匠
73 楼
类似中国有高铁美国没高铁。
会当凌绝顶1
74 楼
网友评论、网友文字如下。 问题的关键是,在如此短的时间里,如此低成本,DeepSeek是怎么做到的? 业内普遍认为:DeepSeek的迅速崛起,皆因不光彩地违规非法蒸馏、偷窃数据、盗用、“山寨”、“整合”他人的模型所致。 彭博社28日报道,微软和OpenAI正在调查与DeepSeek有关的人,他们在2024年秋天就发现,有人用不正当的手段通过OpenAI的API输出了大量数据,他们或与DeepSeek有关。 英国的金融时报也于28日报道,OpenAI表示,他们已掌握了证据,证明DeepSeek涉嫌利用所谓的“蒸馏”(distillation)技术盗用其数据进行开发。 对此,业外人士不免感到困惑,因为开发人员是可以通过付费购买许可证的方式,来使用API将OpenAI的专有AI模型集成进自己的应用程序中,这难道不合法? 况且,OpenAI不是鼓励用户大量使用它的模型和数据吗? 既如此,何来不正当、非法、违规和盗用一说呢? 问题的核心在于:你是怎么利用这些资源的。 OpenAI在开放自己的数据和应用时,并不是无条件开源的,它是有明确的限制条款的。 换句话说,OpenAI的开放前提是说:你可以使用我的训练数据,在我的训练模型基础上,来开发完成你所需要的各类应用,而非是以构建自己的训练模型为目的,达到未来与我竞争的目的。 而所谓的“蒸馏”技术,正是利用像OpenAI这样的功能强大的大模型,以及通过长期投入所积累而成的大数据,来训练属于自己的较小模型,通过“蒸馏”浓缩的方式,在自己的模型上,以更低的成本、更短的时间取得更好的效能。 这在OpenAI的开放限制条款中,明显是违法的。 这,或许才是DeepSeek之所以能够在短时间内,以极低的成本达到可与OpenAI比肩的真正原因。 更进一步,美国人认为,有关中国实体企业在通过“蒸馏”技术训练自己模型的同时,还窃取了大量数据,而这些数据有可能对美国的安全构成威胁。所以不少人对于这种潜在的侵权行为,以及所带来的安全问题深表担忧。 也许有人会争辩,你凭什么说DeepSeek是盗用、抄袭?有证据吗?有!大量证据! DeepSeek的很多回答,与人们向OpenAI提问所得到的回答一模一样!也就是说,DeepSeek真正的原始数据来源,就是OpenAI的数据库。 仅仅改变提问方式就使得抄袭者原形毕现,可不可以抄袭得高明一点,不要这么赤裸裸! 据说胡锡进也看不下去了,不惜站出来洗地,意思是孔乙己的那句话:窃书者不能算是偷。 结果成了越描越黑,这等于承认了偷的行为。 说到这种行为,美国人有治吗? 答案是:好像没有。 如果像类似DeepSeek这样的事发生在美国或英国,如此高调的宣传,以及如此有影响的公司和事件,这足以将你送上法庭,不罚你个底儿掉就不算完。 但是在别国,情形可能完全不同。不但不会感到耻辱,而且会被视为一种爱国行为,能够获得亿万个点赞! 这分明就是两个平行世界! 从小在学校就被告知:天下文章一大抄!只要你抄的,水平高,抄的艺术,不但不会影响到你的信用,而且会成为人人羡慕的英雄! 看看某些人甚至很多人,诡辩,狡辩,小偷逻辑,不以为耻,反以为荣!
硅谷工匠
75 楼
爱迪生每天接一个专利官司。
硅谷工匠
76 楼
中国站在巨人的脖子上砍巨人脚脖子。
T
TXZS
77 楼
whatever!反正物美价廉!爱用不用,爱咋咋地!
糖醋鲤鱼
78 楼
DS所谓的蒸馏技术就是通过反向工程找出openai训练模型技术上的劣势并加以调整和改善,然后把新的算法开源了。如果DS把这些新算法当作闭源代码开发产品也许会有纠纷。现在这些算法开源了每个人都可以下载部署并开发自己训练模型,这就让openai没法去诉讼了。这也是DS聪明的地方,而且间接向别人展示了自己公司的实力。很聪明的做法,唯一不爽的就是那些市场上的所谓大咖ai公司了包括ai芯片制造公司例如英伟达。
见不得不平事
79 楼
DeepSeek开发了一种高效低成本的蒸馏方法。其高效低成本部分震惊了美国业界。而其蒸馏所用数据模型及相关训练资料则违反了相关规则。因此它既有创新也有违规。现在美国业界处于一种难堪的地位,一方面要谴责它违规使用别人的成果,另一方面还要研究学习它的算法以提高自己的蒸馏水平。DS用别人的成果作为自己模型训练的基础属于在华人中经常会见到但会被别人所不屑的“取巧”。另一方面,它开创的高效低成本的蒸馏方法又会加速AI发展,对社会的进步起到推动作用。这就是事物的两面性。任何片面的一家之言都是不足取的。
c
ceocto
80 楼
糖醋鲤鱼 发表评论于 2025-01-31 07:25:10DS所谓的蒸馏技术就是通过反向工程找出openai训练模型技术上的劣势并加以调整和改善,然后把新的算法开源了。如果DS把这些新算法当作闭源代码开发产品也许会有纠纷。现在这些算法开源了每个人都可以下载部署并开发自己训练模型,这就让openai没法去诉讼了。这也是DS聪明的地方,而且间接向别人展示了自己公司的实力。很聪明的做法,唯一不爽的就是那些市场上的所谓大咖ai公司了包括ai芯片制造公司例如英伟达。 ========= 公开的代码跟DS网站上的产品不同(v3),R1的都很差,你去试试,现在好多公司Host了。