马斯克用20万张卡练出的Grok 3能超越DeepSeek吗

今日头条
Toutiao
最新回复:2025年2月19日 0点28分 PT
  返回列表
76265 阅读
17 评论
虎嗅网

“2月18日,马斯克所言“地球上最聪明的人工智能”终于亮相,其旗下人工智能公司xAI正式发布其新一代的大语言模型Grok 3,马斯克本人也在社交平台X上同步开启直播演示。

据直播介绍,Grok 3已超越目前市场上所有已发布的人工智能。在官方公布的测试数据中,其在数学推理、科学逻辑推理以及代码写作等方面表现均优于ChatGPT-4o、DeepSeek-V3等竞品。

Grok大模型是马斯克旗下的xAI公司推出的人工智能模型,其命名源自美国科幻作家罗伯特·海因莱因的小说《异乡异客》(Stranger in a Strange Land)。该系列第一款大模型Grok 1于2023年11月面世,2024年该模型参数量扩展至3140亿,远超GPT-3.5的1750亿。2024年8月,Grok 2大模型发布,在Grok 1基础上全面升级,并在X平台上面向用户免费使用。而此次直播推出的Grok 3,据工程师表示,其所涉及的训练是Grok 2的10倍,且Grok 3已经在xAI内部运行了2周。

据悉,Grok 3训练所用GPU总量为20万个,在第一阶段通过10万个GPU进行训练,耗时144天,而第二阶段的92天中,所用GPU数量拓展到了20万个。此前据报道,印度已启动一个有超过1.8万个GPU的公共计算设施,将对初创公司、研究人员和开发者开放,以促进其国内人工智能发展以及本国大语言模型的训练。相较之下,xAI的Grok 3训练所用GPU总量已远超印度国家级项目GPU总量10倍不止。庞大的算力规模成为Grok 3加速问世的最大助力,也让xAI在日益激烈的市场竞争底气十足。

在直播活动中,xAI的工程师展示了Grok 3的使用,如现场生成一段太空发射的3D动画的代码、制作一款融合“宝石迷阵”和“俄罗斯方块”的游戏,Grok 3均表现良好,这也证明了该模型对于复杂知识具有良好的理解。马斯克表示,Grok 3的功能比Grok 2强大一个数量级。

面对Grok 3的极佳表现,有知名博主Alexandr Wang表示,Grok 3是世界上新的最佳模型,其在聊天机器人竞技场中排名第一,且遥遥领先。Amjad Masad也表示Grok 3似乎是最先进的尖端模型,他认为考虑xAI的处境,该模型的发布无疑是巨大成就。知名播客主持人Lex Fridman同样对该模型印象深刻,表达了对该模型的称赞。

而Grok 3所带来的骚动,实际上比该模型的正式面世要来得早。

此前,DeepSeek在世界范围内掀起热潮。由于DeepSeek-R1模型的优秀表现,以及其代表的低成本训练路线,人们一度开始讨论全球AI话语权的归属问题。尽管人工智能行业尚处于群雄逐鹿的阶段,但是DeepSeek-R1模型无疑为这个世界带来巨大冲击。

继DeepSeek爆火之后,2月13日,OpenAI首席执行官奥特曼发布博文,宣布准备推出GPT-4.5和GPT-5,并公布路线图。

同样在2月13日,马斯克在迪拜世界政府峰会上表示xAI将推出新一代模型Grok 3,并盛赞其“强到让人感到害怕”。而这也引发了人们对Grok 3的猜测,以至于讨论AI话语权可能再度扯向西方。

至此,一场有关人工智能模型的“三国杀”已见雏形。

作为xAI的重要市场竞争对手,OpenAI对Grok 3的反应也引起人们的注意。在今日马斯克的直播活动开始之前,奥特曼在社交平台X发布消息,称GPT-4.5已进入测试阶段,并称其体验“接近通用人工智能(AGI)”,而这一行为被外界视为对Grok 3的紧急“狙击”。

相比于明星产品DeepSeek-R1,“推理+测试时间计算”中,在数学推理、科学逻辑推理和编程三个方面,Grok 3 Reasoning Beta版本综合得分分别为93、85、79,均高于DeepSeek-R1的80、71和65。最新AIME 2025性能测试中,Grok 3 Reasoning Beta版本有93分,高于DeepSeek-R1。前特斯拉人工智能总监、OpenAI创始团队成员Andrej Karpathy通过提前体验指出,Grok 3模型确实可以做到DeepSeek-R1做不到的事。而单纯从测试数据看,Grok 3确实做到了比DeepSeek-R1略好。

尽管Grok 3在测试中成绩优秀,但是仍有分析表现,在 “推理+测试时间计算” 这一测试中,相比于o3-mini(high)或DeepSeek-R1,Grok 3的数学性能并没有显著优势。马斯克表示,Grok 3仍处于早期训练阶段,未来将持续优化。

据了解,自今日起,X平台Premium Plus订阅用户将率先获得Grok 3访问权限。此外,xAI还推出了名为Super Grok的独立订阅服务,但尚未公开定价。马斯克还表示,目前xAI的工程师团队正在训练Grok 3的迷你版本,并指出“迷你版的训练时间更长,有时表现略好于Grok 3推理模型。”

自Grok 3开始,马斯克“再无AI比Grok更优秀”的预言能否成真?以目前AI的更新速度而言,当真难以定论。但就该模型的表现来看,在人工智能的牌局上,马斯克确实甩出了有分量的“大牌”。

g
googlebot
1 楼
没戏的,
龙笑天地
2 楼
deepseek宇宙第一,包子什么时候月经他都能算出来
j
jptv
3 楼
Deep Seek 教育我们体格强壮与聪明没有关系!
R
Riordan
4 楼
如果20万张ai卡都超不过ds,那我真的要鄙视堆卡的公司了,哈
f
franktong
5 楼
你的意思是偷工减料能够超越原版货!
c
cloct
6 楼
还是deepseek厉害 ,不需要训练,直接拿现成的结果,世界第一,反正强国内没人敢不夸。
爬行兔
7 楼
楼下几位经费都断了还反的那是真反呢?
j
jolly11
8 楼
一万卡就很好了
燃烧的褪毛
9 楼
ds这种垃圾还有人夸,上下问题都没办法联系到一起这种基本功能都没有,也就粪坑东大的傻逼会捧着吹了
瞎逛逛
10 楼
马斯克支持一国两制,绿瓦不喷一下他的产品吗?
w
wtf6park
11 楼
不是能不能的问题,是超越多少!我们必须要认清自己的位置,本来ds就没有超越openai只是性价比超强打脸华尔街而已。穷屌丝那一次半次可以称为奇迹,但是富二代只要砸钱,砸很多钱。那么奇迹很难再次上演的。我们有多大的脑子带多大的帽子就好。坚持自己,只要不掉队,等到我们自己的显卡和芯片赶上来就成功了
f
firepoint
12 楼
Crok3: cock rolls over kill 3 women
财富绽放
13 楼
性价比其实也是自己说的,很多大厂都不敢信
s
slimane
14 楼
ds到底成本多少就是个谜,早晚露馅,因为根本没有原创性
裤裆中央总树鸡
15 楼
一个是哪吒 一个是DS. 赢地瘫倒在猪圈里。 谁敢不吹捧?? 不吹捧就是乳滑,如同没人敢黑华痿一样。
郑长仁
16 楼
苟利国家生死以,岂因祸福避趋之?反腐驱邪真汉子,替天行道心无私!马斯克,英雄啊!
o
oligarch
17 楼
AI最终还是要靠硬件实力