马斯克的AI创企xAI开源Grok-1,3140亿参数迄今最大

今日头条
Toutiao
最新回复:2024年3月18日 3点21分 PT
  返回列表
68808 阅读
15 评论
观察者网

当地时间3月17日,特斯拉首席执行官(CEO)马斯克的AI创企xAI正式发布3140亿参数的混合专家模型Grok-1。xAI官方网站称,其遵照Apache 2.0协议开放模型权重和架构。

xAI官方网站截图

据第一财经报道,Grok-1参数量远超OpenAI GPT-3.5的1750亿,是迄今参数量最大的开源大语言模型。

17日,马斯克还在社交平台上发文对OpenAI进行了嘲讽:“告诉我们更多关于OpenAI开放部分的信息。”

2023年11月,xAI官网发布文章,公布了Grok的详细进展。

文章称,Grok是一款仿照《银河系漫游指南》设计的AI,几乎可以回答任何问题,它甚至可以建议要问什么问题。“Grok回答问题时略带机智和叛逆,所以如果你讨厌幽默,请不要使用它”。

xAI官方网站截图

文章介绍说,Grok的一个独特且基本的优势是,它可以通过X平台实时了解世界。它还将回答被其它大多数AI系统拒绝的尖锐问题。

文章指出,Grok仍然是一个非常早期的测试版产品,是“我们在2个月的训练中所能做到的最好产品,期望在您的帮助下每周都能快速改进”。

文章表示,Grok-1的研发经历了四个月。期间,Grok-1经历了多次迭代。“宣布创立xAI后,我们训练了一个330亿参数的LLM原型(Grok-0)。这个早期模型在标准LM测试基准上接近LLaMA 2(70B)的能力,但只使用了一半的训练资源。在过去两个月里,我们在模型的推理和编码能力方面取得了显著进步,Grok-1终于诞生。”

文章称,这是一款功能更为强大的SOTA语言模型,在HumanEval编码任务中达到了63.2%,在MMLU中达到了73%。

为了了解对Grok-1所做的性能改进,xAI使用了一些旨在衡量数学和推理能力的标准机器学习基准,对其进行一系列评估。

在这些基准测试中,Grok-1显示出了强劲的性能,超过了其计算类别中的所有其它模型,包括ChatGPT-3.5和Inflection-1。只有使用大量训练数据和计算资源训练的模型,例如GPT-4,才能超越它。“这展示了我们在高效训练LLM方面取得的快速进展”。

同时,文章也指出,由于这些基准可以在网上找到,并且他们不能排除模型无意中进行了相应的训练。因此,他们在收集完数据集之后,根据去年5月底公布的2023年匈牙利全国高中数学期末考试题,对他们的模型(以及Claude-2和GPT-4模型)进行了人工评分。结果,Grok以C级(59%)通过考试,Claude-2也取得了类似的成绩(55%),而GPT-4则以68%的成绩获得了B级。文章称,他们没有为应对这个考试而特别准备或调整模型。

g
gign
1 楼
关键词是开源,自主研发,遥遥领先指日可待了。 [2评]
x
xiaoss188g
2 楼
一开源,就可以说是中国自主产权了。那一定遥遥领先
n
newerer
3 楼
狗粮很羡慕吧? 古人云:青出于蓝而胜于蓝
y
yyy6park
4 楼
有啥好说的, 芯片你美国佬自己造呀! 不是还要绑架台巴子和小日本? [1评]
不明智
5 楼
狗逼马斯克的AI根本没法与openAI 竞争, 马斯克的AI就是二傻子低智 所以只能开源 想逼迫openAI开源 狗逼,没门 [1评]
w
wilburwang
6 楼
还有荷兰,德国,原料还要边制裁边偷偷买俄罗斯的
w
wilburwang
7 楼
好奇,马斯克cao了你ma? [2评]
R
Riordan
8 楼
马斯克意思非常清楚表达了:我的AI是open的,轮到OpenAI了,你敢open吗? 不敢就改名叫closeAI,哈
不明智
9 楼
. 你那么护着他 他一定操了你妈
不明智
10 楼
. 你那么护着他 他一定操了你妈 让你感觉无比荣耀 所以别人不能骂骂马斯克 骂马斯克就是骂你妈 你个狗逼 马斯克操了你妈给你钱了?
g
gavin02
11 楼
谁操谁妈,有什么重要吗?无所谓吧,不觉得你把时间浪费在骂人上,说明你时间很不值吗?还耽误大家翻页
樱桃儿熟了
12 楼
AI现在就是拼:每一层的矩阵围堵,有几层,硬件算力。
e
eelekim
13 楼
准备遥遥领先
b
bestnearby1
14 楼
中国一批人要笑不拢嘴了,中国国家科研基金又遭殃了。
w
wasabi20071127
15 楼
不开源 大陆AI明显跟不上 没法遥遥领先啊!