媒体:师承ChatGPT的DeepSeek和国运有啥关系? - 2025年2月16日 / 头条新闻

5 个月前

撰文丨关不羽

DeepSeek横空出世，成功破圈。破圈之后，照例就是各自发挥的“六经注我”。其中最值得警惕的，中美双方都出现了借题发挥的“技术孤立主义”。美方的“脱钩论”者把DeepSeek视为技术威胁，剽窃、盗用的指责满天飞；这边则是把DeepSeek渲染为“中美争霸”的一击制胜，自我感觉良好。

好端端的科技成果，却成了地缘政治的符号。妖魔化和神化看似针尖对麦芒，其实都是对科技进步事业的亵渎，是阻挠人类科技进步事业的合谋。

唯有屏蔽杂音，才能直面真相：DeepSeek到底是什么？将会造成怎样的影响？

01DeepSeek师承ChatGPT

1月27日，DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜，在美区下载榜上超越了ChatGPT。随即引发了资本市场的震荡，DeepSeek被形容为“英伟达的最大空头”，英伟达的股价大幅下跌。“DeepSeek碾压ChatGPT，吊打英伟达”的神话就此诞生。

先说DeepSeek和ChatGPT之间的关系。DeepSeek和ChatGPT之间的竞争，是“师徒之战”。两者的师承关系源于“蒸馏技术”，这是DeepSeek快速崛起的技术路径。

通俗地说，“蒸馏技术”就是用一个较为成熟的“教师模型”训练“学生模型”，这一过程类似低度酒蒸馏加工为高度酒。具体操作方式是，“学生模型”每分钟上百万次高频提问，从“教师模型”中汲取数据、学习逻辑。然后在人工干预下优化算法，最终形成独特的个性。ChatGPT就是DeepSeek的“教师模型”，或许不是唯一的，肯定是主要的。因此，说ChatGPT是DeepSeek的老师，不过分吧？

图/AI配图

“蒸馏技术”不是近年来的新发明，发明者既不是中国人，也不是美国人，而是英国佬杰弗里·辛顿在2015年提出的，比阿尔法狗一战成名还早一年。所以，当时“蒸馏技术”只是纯理论的屠龙技——压根就没有成熟的“教师模型”，没法蒸馏。直到ChatGPT等成熟大模型相继投入实际应用，“蒸馏技术”才有了实际应用的空间。因此，“先有ChatGPT，后有DeepSeek”也是无法否认的事实。

显然，DeepSeek不是“天上掉下个林妹妹”，而是站在巨人肩膀上的衍生产品。咋咋呼呼地竭力否认、淡化DeepSeek的师承ChatGPT，强拗“独立原创”的造型，是可笑又可怜的掩耳盗铃。

当然，也不能因为DeepSeek是蒸馏技术的产物，就否认其原创性。蒸馏不等于盗窃、抄袭。要是能一抄了之，哪里轮得到DeeSeek？在蒸馏技术的赛道上，有名有姓的玩家少说也有上百家。DeepSeek能出圈，是有几把刷子的。“蒸馏”大同小异，人工干预的算法优化各显神通。简洁高效的算法是DeepSeek的成功关键，颇有中国特色。

人工智能三大要素——算法、算力、数据，中国长于算法，美国重视算力。这种“偏科”倾向在赛道开启初期就已经显现了。昔日商汤为代表的视觉系AI“中国四小龙”，就是以算法著称。ChatGPT崛起，“算力为王”的大力出奇迹成为主流。风水轮流转，DeeepSeek的勃兴，在一定程度上是“算法复兴”。这种技术风格的转换，在人类的科技进步史上反复发生，是一种常态。

DeepSeek最大的优势是性价比，算法赋能大幅降低了算力成本。省钱永远是商业竞争的王道，绝大部分个人用户都没有很高的专业需求，免费、开源的DeepSeek更有吸引力，这是人工智能商业化应用的成功。

但是，这并不意味着因DeepSeek已经青出于蓝胜于蓝，更谈不上“碾压ChatGPT”。“蒸馏技术”和算法优化是做减法，以简化的方式提高效率。所以，DeepSeek更垂直、更聚焦专业领域，这也意味着牺牲了一部分通用性。比如说，文生图等视觉系技术就不是DeepSeek的强项，和文心一言比都有差距，遑论ChatGPT。而且，蒸馏技术的技术“天花板”到底有多高，现在也很难判断。未来能否实现性能全面超越，并没有清晰的预期。

这从资本市场的表现也可以看出端倪，DeepSeek上架后，微软的股价仅仅下跌了2%。表明了市场投资者还处于观望态度，资本市场用真金白银的站队表态，不是各路“嘴强王者”的唾沫星子可比的。

反而是英伟达的股价“大跌”17%，DeepSeek真是“英伟达终结者”吗？

DeepSeek不是“英伟达终结者”

DeepSeek到底使用了多少英伟达芯片，目前有三个版本分别是五万、一万和两千多，越传越少。其中“只有了两千多”的版本最假，DeepSeek创始人梁文锋本人在采访中就说过，早在公司成立前的2021年就囤了一万块GPU。无论是一万还是五万，比起动辄几十万芯片的大厂产品，都是数量级的降低。大可不必在传播过程中人为夸大DeepSeek的“省芯”。

必须指出的是，DeepSeek的算法优化“省芯”，并不会降低人工智能领域的算力需求降低。算法优化和算力需求的关系，有点类似燃油发动机技术节油和燃油消费需求。燃油发动机开发省油技术，并没有降低汽油消费的总量。因为汽车的燃油成本越低，促进了汽车的普及度，燃油消费的总量不降反增。DeepSeek省芯降低了人工智能研发应用的资金门槛，会吸引更多的投资者进场。

人工智能的研发端将会进一步走向“群狼搏虎”的遍地开花。在应用端，DeepSeek成功实现免费开源模式，大幅推进了人工智能的普及应用，也会产生巨大的算力需求增长。别小看中小企业、个人用户本地部署的仨瓜俩枣，聚沙成塔是巨大的潜在需求增长。DeepSeek不是“英伟达终结者”，而是英伟达的财神爷。

图/NVIDIA官网

所以，英伟达对DeepSeek的态度非常积极，不仅第一时间登陆NVIDIANIM，还给了权威背书——“DeepSeek-R1是最先进的大语言模型”。

至于所谓“股价大跌”，英伟达经历了市值十年增长222倍的超高增长，区区17%的跌幅不痛不痒。这轮回调，不是DeepSeek对英伟达产生了实质性威胁，而是市场投资者借DeepSeek释放一波回调势能。

当然，算力需求增长，未必是英伟达笑到最后。给英伟达造成竞争压力的不是DeepSeek，而是其他大厂的算力芯片。英伟达的大客户谷歌、亚马逊、微软竞相推出自家算力芯片，算力大战已经开打。这场“神仙打架”对人工智能技术的研发、应用无疑是好消息。

因此，强行把DeepSeek树立为英伟达的对手，是莫名其妙的“关公战秦琼”。这种强行对立，不是拔高，而是矮化——低估了Deepseek对整个人工智能领域的结构性冲击。

DeepSeek是计划外的中美科技合作产物

我们应该怎样评价DeepSeek呢？DeepSeek创始人梁文锋给出了标准答案，“我们不是有意成为一条鲶鱼，只是不小心成了一条鲶鱼”。

▲DeepSeek创始人梁文锋（图/视频截图）

DeepSeek的成功完全是计划外的市场产物。一家注册资金1000万的小公司，而不是“国家队”。起点不高，也没有“星辰大海”的宏大目标——DeepSeek的初始目标是专攻金融交易。这样一家“起于草莽”的小民企，打造了一款成功的人工智能产品。不经意间改变了整个产业。这才是科技产业发展的正常模式。各种奇思妙想在开放的市场中竞争、试错，实现从量变到质变的升华。

DeepSeek的成功，没有“赌国运”、中美争霸的宏大叙事，只有朴实的市场逻辑和水到渠成的科技路径。市场需要性价比高的人工智能技术，企业研发满足了市场需求。蒸馏技术从纯理论的纸上谈兵，到成熟大模型开道后真正落地。自然而然，不需要拔苗助长。

DeepSeek不是闭门造车的产物，而是中美科技合作的成果。美国大厂的“教师模型”和算力技术，中国科技企业的研发力量，缺一不可。市场机制的无形之手，总是撮合出“佳偶天成”。那些彩旗飘飘、仪式感十足的“合作签约仪式”十之八九只是“仪式”而已。只有市场机制下的合作才保真。

因此，大可不必刻意强调DeepSeek的原创性、创新性。师承ChatGPT的蒸馏技术、使用英伟达GPU都是无法否认的事实，又何必遮遮掩掩？“微创新”的一小步，也可以是人类科技事业的一大步。瓦特并没有发明蒸汽机，而是改良了前辈的创作。这并不妨碍瓦特蒸汽机叩开了工业化的大门。

一款好产品本身，足以说明一切。DeepSeek无疑是一款好产品，至于是否具备“划时代”的意义，无需“口头加冕”，时间会说明一切。就算没有又何妨？只要有良好的市场合作机制，而不是以邻为壑的自我封闭，划时代的好产品一定不会缺席。

firepoint

5 个月

1 楼

师承？小编你妈给美国强盗师承了多少精液，生了你这狗子？

donhai

5 个月

2 楼

国运压在了一个小小的民企？央企干什么的？

nfsing

5 个月

3 楼

李强能随便见一个名不见经传的小私募寡头，而且做AI模型也不是他的主项目。另外两万块从新加坡或台湾运来的GPU是怎么回事？ [1评]

Edmondon

5 个月

4 楼

sb自媒体怎么就师承了呢?你就一个垃圾低端人口小镇做题家,彻头彻尾的科盲有什么资格写这个话题

红

红朝商人

5 个月

5 楼

师承个屁，只要人才技术到位，中美的AI技术交替领先。有些自媒体总喜欢拍西方的马屁，毫无自信

dj256

5 个月

6 楼

DeepSeek 有自己的技术发现，不只是蒸馏，只是蒸馏的话任何一个公司都可以复制，更不要说那些资金雄厚的大公司。现在大公司都纷纷上架deepseek，本身就很说明不只是蒸馏而已。

ghana001

5 个月

7 楼

人家就是微型私募寡頭又怎樣?人家能做deepseek啊.你們台狗那麼大那麼優秀做一個出來孝敬美國主人啊你怎知人家走私gpu,你美國主子都不敢確定,你這狗竟逆主子的意說人家走私再給你這孤陋寡聞的狗一點知識,當年美國做黑鳥時還從蘇聯走私鈦合金呢

ghana001

5 个月

8 楼

不是冰川思享庫,是冰川底能院

和

和平奖

5 个月

9 楼

那最先进的AI是哪家？是最先进而不是最好用，

Show出你的下限

5 个月

10 楼

😂😂😂 ds充分展示了中共的拿来主义的匪类本质 [2评]

renanxing3390

5 个月

11 楼

苦逼的台弯

ghana001

5 个月

12 楼

中共怎匪類本質? 台狗還拿台積電做護盾呢.說無恥,誰及台狗?

wmqjsgg

5 个月

13 楼

偷也是一门技术活 [1评]

斯

斯文的地主

5 个月

14 楼

拿来主义要彻底变成自己的东西！要完全消化！这个就要理性的来分析：你看看西方畜生很蠢的亚洲四小龙养的白白胖胖都是在给中国人养！香港、台湾、日本都头来都是送给中国的！包括马六甲就是送给中国的！ . 知识点：拿来主义要彻底的拿来！ . 海外华人华侨相信中国！中华民族伟大复兴万岁！ . . .

treebear

5 个月

15 楼

狗粮开始给Deepseek找爹了，问题CloseAI是封闭的，就是想抄也没有代码啊。

jimlxs

5 个月

16 楼

怎么个偷法？Deepseek是开源的好吧🤪

push

5 个月

17 楼

这个傻逼自媒体每次都在反思😂😂😂

那

那就好好生活

5 个月

18 楼

胡说八道的反思怪

史

史前巨混

5 个月

19 楼

蒸馏不光是openai更多的是国内开源llm

moomin

5 个月

20 楼

无知无耻。蒸馏是一种模型压缩算法，需要知道教师模型的参数，目前ds只发布了qwen和llama的distill模型，都是开源模型，闭源模型没法做蒸馏。说ds盗用openai的数据，有证据吗？那就公布出来，没证据就闭上你的狗嘴! 这帮造谣的死玩意儿就该乱刀砍死，人人得而诛之。

壑

壑颦

5 个月

21 楼

任何一个技术都是在前人大量成果基础上实现的，就人工智能来说，OPEN AI始于拿来谷歌的Transformer架构，而后者又起于上世纪80年代卷积神经网络（CNN）和循环神经网络（RNN），第一次把神经网络的研究付诸实践的，是1960年代Rosenblatt 的模型MP。。。你说，到底是谁抄谁的？

谁

谁主沉浮？

5 个月

22 楼

傻逼作者

高

高压锅

5 个月

23 楼

自干狗真是贱啊

犬

犬涼不高兴

5 个月

24 楼

狗粮风向文的特点之一就是，标题先用谣言定性，然后围绕谣言开始喷粪，喷的煞有介事跟真的似的

jxxy1234

5 个月

25 楼

美方的“脱钩论”者把DeepSeek视为技术威胁，剽窃、盗用的指责满天飞 xxxxxxxxxxxxxxx 胡说八道

hongjun

5 个月

26 楼

狗子破案了，你没爹都不敢说有证据

这

这是神马情况

5 个月

27 楼

关系就是必须得给韭菜屁民打🐔血，继续让他们做大国白日梦！不然社会就会不稳定，习帝指挥下经济下滑，对党妈统治造成挑战！哈哈

shankecn

5 个月

28 楼

我还以为是个分析文章，上来就下结论。。。

刘

刘霍珲

5 个月

29 楼

作者对技术，金融和国家战略都一知半解，自以为是。

molen1

5 个月

30 楼

这帖子基本是胡言乱语。

树

树指

5 个月

31 楼

因为没抄，就发明一个新词“蒸馏”，这样的话，科学发展就应该叫科学蒸馏。

瓜

瓜果梨桃

5 个月

32 楼

这篇文章的作者就是头猪，自己做不出来，却放肆地胡扯别人。 deepseek完全开源了，说说那段代码是抄袭别人的。这篇文章的作者需要知道的是：自己是个完蛋货，就别迁拖别人也是完蛋货。

我

我爱北京的秋天

5 个月

33 楼

像高中生作文。

匿

匿名2018

5 个月

34 楼

jb毛关系

江

江南游侠

5 个月

35 楼

难怪美国开始蒸馏DS了😄

雁

雁过留声机

5 个月

36 楼

新闻来源: 冰川思享号

雁

雁过留声机

5 个月

37 楼

新闻来源: 冰川思享号