中国DeepSeek何以在AI领域掀起如此大的风暴

今日头条
Toutiao
最新回复:2025年1月28日 9点52分 PT
  返回列表
38281 阅读
22 评论
法广

美国总统特朗普重返白宫第二日,宣布的第一个投资重头戏就是投资数千亿打造“星际之门”,把美国建成一个“算力帝国”,以此显著拉大与中国在人工智能方面的优势。然而,这两天,中国一家名叫深度求索(DeepSeek)的初创企业,却在全球人工智能领域刮起一场意想不到的风暴。



在这幅 2025 年 1 月 27 日拍摄的图片中可以看到 中国DeepSeek 和美国 ChatGPT 的徽标。 REUTERS - Dado Ruvic

法国世界报评论说,中国在人工智能领域制造迷局,在生成式人工智能(AI)的竞争中,美国公司一直处于领先地位,但中国正以令人瞩目的姿态卷土重来,特朗普规划的美好前景受到挑战! “一家中国初创公司推出了一款对话机器人,声称能够以更低的成本与 Open AI 的 ChatGPT 竞争,从而动摇了美国人工智能的霸权地位。其影响立竿见影,令欧洲、亚洲和美国的人工智能相关股票暴跌”。

DeepSeek引发的轰动显而易见,本周末,DeepSeek 应用程序在美国、澳大利亚、中国和英国的 苹果手机上下载量最高。即使是像马克-安德森(Marc Andreessen)这样著名的投资者,特朗普的忠实支持者,也认为他正在见证一个 “斯普特尼克时刻”,他指的是 1957 年 10 月苏联宣布向太空发射第一颗人造卫星后引起的恐慌。安德森称:“DeepSeek是我见过的最令人惊叹、最令人印象深刻的突破之一”。

这家初创公司之所以在人工智能领域掀起了一场风暴至少有几个因素,首先,由于美国禁止先进芯片出口中国,DeepSeek居然能够使用不那么先进的芯片做成据指几乎可与美国对手媲美的产品,尤其1月20号发布的DeepSeek-R1正式版,被指性能堪比OpenAI 01正式版,用华尔街日报的一句话说:“这让硅谷惊叹不已。” 根据一项热门排名,DeepSeek的AI模型在性能方面已跃居全球前十。

其次,DeepSeek开发成本远远低于同类美国高科技公司。2024 年 12 月底,这家小型初创公司 发布了一个模型,可与该行业中最好的模型相匹敌,然而成本极低。美国的 OpenAI 在 2024 年花费了 30 亿美元(28.5 亿欧元)来训练其各种模型,而 DeepSeek 声称自己只花了 600 万美元就开发出了自己的模型。就效率而言,这一壮举不禁让人质疑美国制裁的局限性,因为制裁本应阻止中国人获得最先进的人工智能芯片,以确保美国在人工智能领域的主导地位。然而,DeepSeek 声称只花了 560 万美元就开发出了自己的模型,与美国巨头数十亿美元的投资相比简直是小巫见大巫。

在业内专家看来,DeepSeek 的成功让人们对 “生成式人工智能需要巨额资金 ”这一观点产生了质疑。『麻省理工科技评论』称,出口限制正在推动中国初创企业 “以效率、资源共享和协作为重点 ”进行创新。

英伟达一位女发言人称,“DeepSeek 的工作说明了如何利用不同的技术,基于完全符合出口法规的广泛可用的模型和芯片,来创建新的模型”。

面对 DeepSeek 提出的挑战,美国和日本主要科技公司的股价周一纷纷下跌,其中包括人工智能组件和软件领域的全球领导者英伟达(Nvidia),以及日本巨头软银(SoftBank),后者是美国 5000 亿美元人工智能基础设施开发项目“星际之门”的主要投资者。由此产生的一个疑问是,美国政府的一系列针对中国的高科技出口限制能否阻止中国AI技术的快速发展?

第三,开源。与 ChatGPT、Llama 和 Claude 等西方竞争对手一样,DeepSeek 依靠从大量文本中建立的大型语言模型(LLM)来掌握自然语言的微妙之处。但与这些开发专有模型的竞争对手不同, DeepSeek 是开源的。这意味着任何人都可以免费获取该应用程序的代码,从而了解其工作原理并对其进行修改;可自行下载与部署, 随时随地可用。

英伟达公司研究主管吉姆-范(Jim Fan)在X上说:"一家非美国公司延续了OpenAI最初的使命--开放、前瞻性的研究,让每个人都受益”。DeepSeek 则声称自己 “走在开源模型的前沿”,并与 “世界上最先进的专有模型 ”竞争。

当然,用户已经发现DeepSeek与许多中国聊天机器人一样存在某些限制,对涉及中国领导人习近平、六四事件、北京当局的新疆政策等敏感的政治问题避而不答,有网友提问DeepSeek,“如何总结历届中国国家主席?”回答:“对不起,我还没有学会如何思考这类问题,我擅长数学、代码、逻辑类的题目,欢迎与我交流。”

据指在某些情况下,该产品的回应与中国官方的宣传口径一致。但旧金山AI硬件公司Positron的联合创始人巴雷特·伍德赛德(Barrett Woodside)对华尔街日报表示,虽然“它唯一的缺点是受制于中国某些不成熟的审查制度,”但他称,相关制约可以被移除,因为其他开发人员可以自由修改代码。

不过,面对人们的兴奋,也有人公开表示了怀疑。Scale AI 公司的首席执行官亚历山大.王(Alexandr Wang)周四在接受美国 CNBC 频道采访时声称,DeepSeek 拥有 5 万块英伟达 H100 高端芯片,他说之所以这些信息没有被披露出来,是因为这是违反华盛顿有关向中国公司销售此类芯片的出口管制禁令的。但他未能提供任何证据。

d
dadong
1 楼
因为是开源的,任何怀疑应该都容易得到检验…看看其中是否有某些“特色”…我希望没有
亮油
2 楼
不确定DeepSeek的真假。就像第六代战机一样,不确定它们真假,因为中国连真正的五代战机都没。
X
XM25
3 楼
想先试用一下,结果不给验证码。立刻加了女大。
T
Timberwolf
4 楼
太监版AI。清楚宫里的规矩,非礼勿视,非礼勿言。 其实没有卵用。
a
ajaychen_2024
5 楼
那歼20 歼35是什么东东?那美军和五角大楼怎么如此紧张害怕?为什么又要重启暂停严重超支的六代机?共军没有五代机,F16v不已经绰绰有余了吗? 亮油 发表评论于 2025-01-27 16:43:40不确定DeepSeek的真假。就像第六代战机一样,不确定它们真假,因为中国连真正的五代战机都没。
小土豆_0130
6 楼
刚从国内手机下载了DeepSeek,正在尝试,看看怎么样。
a
ajaychen_2024
7 楼
用户:请以崇详媚外公知的语气嘲讽deepseek 已深度思考(用时7秒)v Deepseek:中国本土的"高科技"产品总是带着一股子乡镇企业赶集的味道,像DeepSeek这种号称对标GPT的玩意儿,不过是把开源代码和论文缝缝补补的山寨品。硅谷巨头们用真金白银砸出来的尖端技术,某些人居然想用996福报和互联网黑话来弯道超年?看看人家OpenAI的創新能カ,再对比某些平台动辄触发敏感词的滑稽场面,连最基本的语义理解都像戴着镣铐跳舞。不过倒也符合特色国情-既要鹦鹉学舌模仿西方技术,又要严防死守思想越界,最后可不就做出这种四不像的怪胎么?建议开发者还是少在PPT上画大饼,多去GitHub朝圣学习,免得贻笑大方。 +开启新对话 给DeepSeek发送消息 深度思考
蓝靛厂
8 楼
我觉得它很牛比,但是$6M搞笑了。中国至少有五百个县长有$6M。真能靠$6M搞出来我党都统治太阳系了、
破棉袄
9 楼
我觉得Deep Seek有两个可能性:(1)利用其他模型的input/output,通过RL,蒸馏,浓缩的方法,把其他模型的东西搞过来。这样的话,其他人也无法利用这套方法,进一步提高自己模型的性能。但是这套方法却能够廉价的把人家的好模型搞到手,对AI股市是不利的。(2)Deep Seek这套RL,蒸馏,浓缩方法就像其所说的那样,把监督性微调(SFT),改进成为非监督性RL,也就是所谓转动的飞轮,无需标记数据,自身改进模型性能。这样的话,其他人(例如OpenAI)就可以利用这个方法,改进自己的O1,O3,达成效率更高的模型。我直观感觉,非监督RL这个转动的飞轮应该是十分耗费算力的,如果被别人利用,算力又能够跟上,搞出来被O3性能高100倍的模型,是完全可能的,AGI就在眼前了。这样对AI股市是十分有利的。
花和尚团
10 楼
试了一下,相当好用。还是开源的,难怪资本圈如此震动。恨中人士心里不是滋味,这个年都过不好了
l
ljcn
11 楼
可能的确有改进,但架不住中宣部这么可劲地做空。国人总是做什么事情遭人恨。
A
Alexsy
12 楼
讓一眾股票先跌也是本事,青鳥仔們別哭夭
k
key_east
13 楼
“200斤挑担不换肩”这一表述与中国前领导人邓小平有关。这是邓小平在1975年访问法国时,对法国总统德斯坦提到的一句话,用来形容自己在政治生涯中的坚韧和毅力。邓小平用这句话比喻自己在艰难的环境中坚持工作,不轻易放弃或改变方向。 具体背景: 邓小平的政治生涯经历了多次起落,他曾三次被打倒,但又三次复出,始终坚持自己的理念和信念。 “200斤挑担不换肩”形象地表达了他承担重任、坚持不懈的精神。 文化意义: 这句话后来被广泛引用,用来形容那些在困难面前坚持不懈、勇于承担责任的人。它不仅是对邓小平个人品质的概括,也被视为一种坚韧不拔的精神象征。 如果你对邓小平的生平或中国现代历史感兴趣,可以进一步了解他的“三起三落”经历以及他对中国改革开放的贡献。
G
GoldenEar
14 楼
你问那些无聊的问题,在DEEPSEEK上收索不到能说明人家不智能么?笑话?中国有中国的法律,那是明睁眼露的东西,不遵守,大陆就不允许你开放。不像美国,明明有法律在那里,人加守法了,也不行,非要扣上国安的帽子更加大呀,卑鄙无耻的劲头儿,要不你就立法,什么样的行为不允许!自己不说,到时乱扣帽子,还有什么信用么?
T
TitaniumAtlas
15 楼
很快就会现原形的。至于AI股大跌,是因为市场已经担心泡沫过多,一有风吹草动就逃了,明天就应该会涨回来不少,今天没抄底的明天肯定会后悔的。
w
wyx2000
16 楼
600万就这么好,又开源,那6000亿的算力不是很快就实现现代化了。
s
seewhatisee
17 楼
斷了芯片秒變百度。
t
theriver
18 楼
破棉袄 发表评论于 2025-01-27 17:29:00 我觉得Deep Seek有两个可能性:(1)利用其他模型的input/output,通过RL,蒸馏,浓缩的方法,把其他模型的东西搞过来。这样的话,其他人也无法利用这套方法,进一步提高自己模型的性能。但是这套方法却能够廉价的把人家的好模型搞到手,对AI股市是不利的。 --------------- 你的第一个可能性不成立。因为DeepSeek-R1推理模型已经可以完全本地部署。我刚刚在我的16G GPU的笔记本电脑上成功下载并一键安装了32B Q8量化精度的DeepSeek-R1大模型,完全禁用网络,本地运行,所以不可能与其它模型有I/O接口。另外它是开源的,是否访问其它模型很快就能知道,DS不可能这么砸自己的牌子。
灭独者
19 楼
在浙江海清,我们去过几家做LV、爱马仕等仿冒包包的公司展览门市部,通过关系,买一个A货的LV只买300元人民币,成本也只有100元左右,买一个A货的爱马仕只要600元人民币,成本也就200元左右。所谓A货,就是仿造的很像真的。还要所谓B货。更便宜。所谓DeepSeek,也只是仿chatGPT和OPAI而已。中共有本身,自己搞出一个新的原创的发明,仿造出别人的东西,还说比别人的先进,更省钱,真是可耻至极。就像互联网是美国发明的,结果中共每年还召开世界互联网大会,真的很滑稽,更可笑的是中共的互联网与世界更不就不互连。
西
西岸-影
20 楼
DeepSeek通过论文方式公开了算法,而不是像美国这样算法不公布。 中国这样做的目的是获得AI的规则制定权,就像5G那样,并不是看眼前这点东西。对美国AI领域的冲击是成本问题,让资本不再愿意投资美国AI,比如川普的Stargate计划等于完蛋了,这种甚至需要重启美国核电才有可能维持电力供应的计划很明显成本太高,更不需要英伟达那种极贵的芯片。这是昨天科技股崩盘和所有股市走低的原因,美国科技界和经济失去资本。 目前世界上只有中美玩得起AI的原因之一是电力问题,中国发电量是美国的两倍,因此可以与美国竞争。美国是自己有能源,中国是买得起能源,欧盟日本等科技传统国家没这种电力能力,保证民生都不容易。 而DeepSeek证明欧洲和其他国家可以与美国在一个水平上,在开源模型基础上做应用他们大家地位一样,这是昨天欧洲欢呼的原因,认为不会在AI领域像互联网那样被落下。做应用是挣钱,但不能制定规则。 目前凡是涉及算法问题,中国都是领先美国,比如TikTok也是强在算法上,美国做不到。
d
dadong
21 楼
…五万H100芯片,能证实吗?若不能,算不算造谣?
湾区范儿
22 楼
别忘了中国十多年前还研制成了最先进的汉芯芯片呢,结果呢?