陆媒:硅谷惊恐了!中国AI大模型突然弯道超车

今日头条
Toutiao
最新回复:2025年1月25日 17点52分 PT
  返回列表
66879 阅读
49 评论
胡锡进观察

人工智能是美国发誓要确保领先中国一大步的领域,也是美国极力试图锁住中国进步的前线。所以开年的1月20日,中国的AI公司推出全新的DeepSeek开源模型,让美方的AI观察家们几近“破防”。

“中国的人工智能越来越好,而且更便宜”,这是他们的惊呼。一个据称是Meta员工发的帖子写道:“DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌。”因为在前者的低成本高歌猛进之下,后者无法解释自己超高预算的合理性。

去年12月,这家名为“深度求索”的中国公司推出DeepSeek-V3,在全球AI领域已经引起震动。它的训练成本极低,甚至不到美国最先进GPT-4o训练成本的二十分之一,但是性能却可与之同处第一梯队。今年1月DeepSeek推出的R1模型更是获得了业内人士的认可,甚至被认为在推理和数学等领域比美国的大模型更加优秀。

▲Deepseek-V3与多个国内外大模型的测试数据对比。(图源:“Deepseek”公众号)

尤其让美国AI观察家们诧异并且感到沮丧的是,以往为了阻止中国在人工智能领域的发展,美国政府一直在严格限制对中国出口高算力芯片,甚至不断加强努力,防止中国通过第三方获得先进芯片。DeepSeek仅仅用了英伟达为配合出口管制为中国市场量身定制的“阉割版”H800 GPU,但神奇的事情发生了,它们组合出的效果不亚于使用高性能芯片“卷算力”的美国大模型,而且因为它是完全开源的,专业人士可以清晰观察DeepSeek是如何用更有效率的训练方式与细腻的技术手段扬长避短的。

这些也是那名Meta员工“破防”的原因:使用了高算力H100 GPU的Meta Llama 3系列模型,其计算量足可训练DeepSeek-V3至少15次,但是最终表现却不及DeepSeek。美国《财富》杂志毫不掩饰地嘲讽道:美国刚刚承诺投入数千亿美元来捍卫其人工智能领导地位,一家“预算低得可笑”的中国初创公司可能已经破坏了这些希望。

DeepSeek的大胆创新震惊了业内,虽然限于硬件设施以及成本投入等原因,它与美国的先进AI大模型比起来还有点“偏科”,但是却给AI行业带来了不少深度思考,它似乎在开创一条AI发展另辟蹊径的可能路线。

▲扎克伯格2024年7月表示,开源是AI未来的方向,美国要领先中国AI数年的目标不现实。(图源:上观新闻)

大家知道,AI大模型领域的三大要素是算法、数据和算力。算力如同人大脑的神经元,一个成熟的大模型需要训练,理论上说,基础算力越大,大模型就应该越聪明。所以美国各团队之间形成了对基础算力无穷无尽的追求和比拼。马斯克旗下xAI的超级计算数据中心装配了10万颗英伟达H100 GPU芯片,堪称当今世界最强大的AI训练集群之一 。OpenAI创始人奥特曼也不甘示弱,表示将投入1000亿美金,在得州建设10座数据中心,未来4年还要耗资5000亿美金在全美打造20个超算集群。人们形成了一个印象:谁的GPU芯片集群大,谁就将稳操胜券。

然而有一种可能是,基础算力的无穷堆积不排除是阶段性浪费,这种浪费不仅是芯片的过量使用,还有对电力的过量消耗,AI沿着这个路线狂奔,前方究竟是什么,是否存在陷阱和弯路,都是未知数。一个实际情况是,人类的现实需求是有限的,而且是独特的,基础算力应当与算法、数据形成最佳组合,而实现这样的最优解,是真正的考验。

DeepSeek的意义在于它没有跟着美国AI公司带动的潮流“卷算力”,它也卷不动,但它却在创造组合的最优解方向做出大手笔开拓。换句话说,它以极低成本打开了AI探索的一个新方向,展示了新的可能性,在具体落地实现和理论创新之间找到了一个平衡路径。DeepSeek 大模型的训练成本仅557万美元,价格仅有GPT-4的1%,无论是这样的低成本还是注重细节的技术,都更契合先进科技一边服务现实,一边滚动发展的普世逻辑。

▲在2025年达沃斯论坛上,AI科技初创公司Scale AI创始人亚历山大·王(Alexandr Wang)公开表示,中国人工智能公司DeepSeek的AI大模型性能大致与美国最好的模型相当。(图源:第一财经)

DeepSeek的出现有可能带动一波有规模的仿效,成为算法创新的催化剂。前Open AI联合创始人、Tesla AI团队负责人安德烈·卡帕西在社交平台上发文称,DeepSeek-V3的出现也许意味着不需要大型GPU集群来训练前沿的大语言模型。还有人表示“如果DeepSeek的创新是真的,那AI公司是否真的需要那么多显卡?”

Axios认为,美国限制高端人工智能半导体和技术向中国流动的政策可能有助于美国在人工智能性能曲线的外围保持领先地位,但这也加速了中国更有效地构建高端人工智能的进程。是啊,中国这样已经有了雄厚科技资源储备的国家是不可能被真正压制的,美国从一个方向制裁,只会刺激中国更全面、更有韧性的进步,甚至“弯道超车”。美国的“小院高墙”最终困住的是谁,还说不清呢。

新侨张
1 楼
不是说得真切吗? AI之争是中国人和在美中国人之争
w
wmqjsgg
2 楼
小学时思想?
斯文的地主
3 楼
海外华人对中国充满信心! 海外华人支持中国共产党! . 现在当前首要就是统一台湾省,全球华人期盼早日解放统一台湾! . 这就是海外华人支持中国共产党的原因! 海外华人坚定支持中国共产党! . 全球华人支持习近平! 中华民族统一伟大! . . .
这是神马情况
4 楼
然并卵!!再厉害都要听党的话,跟党走,为党妈统治服务!!参考文辛一言智障!哈哈 [1评]
对不起我是警察
5 楼
美国先进芯片+中国码农人矿的产物
T
Tulanian
6 楼
嘿嘿,就看美国接下来又要丧心病狂以威胁国家安全为由制裁deepseek……?! BYW, deepseek 已经app 商店冲入top 10 下载的应用。 我下载了也正在好用,超过ChatGPT。 以后也真不需要用Google search等了!!
j
jxxy1234
7 楼
这种傻逼回复只会让正常人更恨狗杂种 16 亿坨屎就养了你们这边逼玩意儿?! [1评]
文学少年
8 楼
价廉物美才是让人家破防的根本原因。
1
13MJK
9 楼
吹牛又超车了
这是神马情况
10 楼
你脑袋里除了屎粪就没有其它东西,如果是这样,我可以理解你的发言!话说回来,你自己去“豆包”问一问朝鲜是不是民主国家就知道了!89学生运动,它根本就不回答!!哈哈
n
netcamel
11 楼
美国最强、最厉害的是源源不断地美钞, 无论是搞研发、搞军事、搞行政管理还是搞其它国家, 如果一堆美钞搞不掂, 那就再来一堆, 例如马斯克用钱烧火箭。 可笑的是, 拜登却狂挖美元的墙角。
无视生非
12 楼
美国的劣势是养着一堆没啥卵用的狗粮,天天搞意识形态,最终结果可想而知。
j
jieraaaa
13 楼
最先进显卡都不卖给你了,还在这自娱自乐呢。问问你的ai车水马龙怎么画吧
m
mike3
14 楼
所以必须对中国封禁所有AI芯片!
刘霍珲
15 楼
DeepSeek还需要时间积累。最近一直在测几个大模型,Deepseek比chatgpt和豆包在很多方面还差一点,但豆包的的确确可以和chatgpt分庭抗礼,各有胜负了。
h
hotcpu
16 楼
把技术的事留给技术吧,别往上套政治了。 deepseek 的技术优势是他的训练方法。 而这方法是基于蒸馏其他大模型而来的。 换句话说, 在其他大模型完成训练的基础上才有效。 这可以大幅降低进一步训练的成本。 但隐患是他的模型并不是从材料里直接训练出来的, 开源也许没问题, 一旦蒸馏被禁止他的成本就会直线上升。
大春哥
17 楼
三哥三嫂在路邊掩口偷笑了
W
Washington001
18 楼
最近一段时间中国的六代战机、AI模型、机器人搞得不亦乐乎。在全世界范围的正面影响还是非常大的。美国主流媒体也在讨论DeepSeek的影响。当然不会忘记提醒DeepSeek是独裁国家的AI模型,OpenAI是民主国家的模型。搞得美国人都烦了。在印度网站上过去印度人对中国还是六个不服,七个不忿的。现在都在老老实实说怎么面对这样的差距。DeepSeek是戳破美国AI泡沫的那根针。
j
jeffinvade
19 楼
“DeepSeek仅仅用了英伟达为配合出口管制为中国市场量身定制的“阉割版”H800 GPU” 看来足够的H800还是够用的
z
zilliz
20 楼
看来研究算法比(硬件)实现算法更重要
斯文嗨盗
21 楼
斯文嗨盗
22 楼
其他大模型本来就不是开源的 你告诉我蒸馏怎么被禁止
斯文嗨盗
23 楼
kimi也不错
W
Washington001
24 楼
皮夹克不久前在骂拜登对中国的芯片禁运。估计那时他就知道中国的AI模型并不需要那么多的计算能力。芯片禁运阻挡不了中国AI的进步,反而促进中国搞出更好的模型出来。中国的AI模型在世界一推广,那么多芯片卖给谁?购买和持有关AI的股票的人要谨慎一点。从美国的AI公司,AI芯片股、那些相关的能源电力股、炒作AI应用股,泡沫都很大。在DeepSeek和字节跳动的模型出来后川普的5000亿美元AI投资就成了一个笑话。现在马斯克也不吹嘘他的垃圾xAI了。美国媒体也不提了。现在提起AI就是中国的DeepSeek、ByteDance的Doubao和美国的OpenAI和google的Gemini了。马斯克的xAI和Meta的开源都不怎么样了。AI最大的阻碍就是成本,并且成本严重影响推广和企业获利。中国的模型完美地解决了这个问题。比美国的大力出奇迹的模型具有天生的优越性。
W
Washington001
25 楼
美国现在的几个在搞AI的公司都有了几十万到上百万张AI芯片的计算能力了。还都准备在2025年扩张到100多万到200万张。这是多大的投资啊。微软号称今年要投资800亿美元。现在看来都是浪费了。
随意岁月
26 楼
meta开发团队的高级成员任何一人的年薪,都超过DeepSeek的开发成本了
e
evision
27 楼
Deepseek都能自我审查,确实牛逼
e
eric703
28 楼
笑死, 但凡拜登没对中国禁运, 敞开了卖英伟达芯片,说不定现在就把大量的中国科技公司坑死了。 现在看来国运势不可挡啊。
a
ak47a
29 楼
中国AI大模型突然弯道超车,这不算什么惊雷爆炸,后来者居上,那是中国一直以来从没有间断的事情。 人工智能的发展,不但要有硬件,还要有整合能力和市场应用。 三要素缺一,都有阻人工智能的发展。
金三
30 楼
中国天天弯道超车,这些男的当龟公五毛的货,不吹牛B,14人矿会死光的。
E
Edmondon
31 楼
继续竞赛,美帝应该建2000个超大集群,200个核电站为它们供电,当然中国只需要其规模的1/20甚至更小,5年后就见分晓
b
bbdxiaozhu
32 楼
爱玲都退赛了,AI就不要瞎逼逼了,逼得今天就要收复台湾就砸自己脚了
今日雨果
33 楼
“ 把技术的事留给技术吧,别往上套政治了。 deepseek 的技术优势是他的训练方法。 而这方法是基于蒸馏其他大模型而来的。 换句话说, 在其他大模型完成训练的基础上才有效。 这可以大幅降低进一步训练的成本。 但隐患是他的模型并不是从材料里直接训练出来的, 开源也许没问题, 一旦蒸馏被禁止他的成本就会直线上升。” 。 愿闻其详
意见没
34 楼
AI模型建立及优化比的基本上是数学及逻辑知识,比较一下中美教育在这两方面的差距就能看出究竟哪方会更有优势了
笑点
35 楼
胡阿狗又开始放假谎屁了
笑点
36 楼
遥遥领先!是五毛的嘴逼部队强大武器! [1评]
今日雨果
37 楼
。 小雨对人工智能的地位及作用的理解: 〇 Réf-6 https://hugoaujourdhui.org/livre-blanc/philosophie/humanismeq-eq-iq-aq 。 。 。
t
tiger500
38 楼
DeepSeek是靠算法或软件或人的智能,不是靠海量的硬件堆积。
f
fengfengloup
39 楼
你问问你主子呗。 紧张不? [1评]
金山浪人
40 楼
丑国这帮老年痴呆政客真的是糊涂到病入膏肓,连现代资本主义基本原理都忘记了,阻止别国向高端发展是“倾销”!这是连100多年前的“八国联军”都明白。
笑点
41 楼
可紧张了,呵呵!对手是个靠吹牛逼撒谎欺骗骂街洗地的伟大人物,你说能不害怕吗?!靠!哈哈😂吓死了!!
j
jxxy1234
42 楼
狗杂种
今日雨果
43 楼
. 史上第一次,本发明提出HQ,从而使EQ、IQ、AQ更上1层楼、凝聚、翱翔。 . 我在 2009年的这项发明可以引领“人工智能”走出丛林、丛林法则: 人道主义商(HQ) https://hugoaujourdhui.org/livre-blanc/philosophie/humanismeq-eq-iq-aq . .
f
fkxfh
44 楼
正解,所以这是开源的成就,不是哪个国家的,可惜很多人根本不理解,看到个标题就开喷。
6
6520
45 楼
美国惊恐了, 欧洲惊恐了, 日本惊恐了,中国以外全世界惊恐了, 惊恐个啥? 惊恐裆妈开始吹了
a
anywho
46 楼
在用、太好用了、
韭菜梗
47 楼
反过来想,美国不限制芯片的话就被甩开了
b
bluej
48 楼
惊恐,震惊,美国人是被吓大的吧?
f
franktong
49 楼
花不越钱想偷工减料。用嘴吹!