Meta 上周发布的Llama 4 模型排名被撤,新排名落后于Llama 3

N
Nizhenda
楼主 (北美华人网)
上周meta 发布的llama 4 模型被发现其训练数据存在海量“题库”内容,属于特供版,现有排名已经被lmsys撤下,重新评估后其排名跌倒了32, 低于一年前发布的llama 3。
公司gen ai 部门领导周末召开了紧急会议,决定不把此事定位0级事故(sev0).
至于由谁和如何把次消息告知扎克伯格,并避免他在下周公司举办的fireside chat论坛和微软CEO satya nadella 交谈过程中出丑,众vp们仍旧一筹莫展。
h
hankzhang
他老婆会不会在这里看到
一个用户
买它妹们情何以堪啊
b
bjeam
回复 1楼 Nizhenda 的帖子
正好有个借口继续裁人。这个垃圾公司除了裁人也没别的招
K
Kubo
小扎又要发脾气了
一个用户
Kubo 发表于 2025-04-12 20:36
小扎又要发脾气了

这个事情换谁都要发脾气啊
a
aegeanboat
不是sev 0,也是个sev 2吧
g
goodluckall
小扎还不知道?
K
Kubo
goodluckall 发表于 2025-04-12 20:54
小扎还不知道?

老大一般都是最后一个知道的
一个用户
goodluckall 发表于 2025-04-12 20:54
小扎还不知道?

re 小札必须时刻关注这个排名,lol
y
youdai
惨不忍睹,即便作弊还不如同行早出的模型,meta可以彻底歇菜,卖卖广告得了。开源的大旗让中国公司来扛
h
helloterran4
Nizhenda 发表于 2025-04-12 10:26
上周meta 发布的llama 4 模型被发现其训练数据存在海量“题库”内容,属于特供版,现有排名已经被lmsys撤下,重新评估后其排名跌倒了32, 低于一年前发布的llama 3。
公司gen ai 部门领导周末召开了紧急会议,决定不把此事定位0级事故(sev0).
至于由谁和如何把次消息告知扎克伯格,并避免他在下周公司举办的fireside chat论坛和微软CEO satya nadella 交谈过程中出丑,众vp们仍旧一筹莫展。

华人大妈还没有意识到,这基本上奠定了大模型竞赛的胜负
llama出局,意味着全世界所有信息敏感的行业,本地部署的大模型只剩下两个选择:
deepseek和qwen
属于是杭州内战了。
s
shzshtchjl
上周公司内部就有国人工程师爆出了此事,并提上了辞职报告
C
COHomeSearch
小扎现在只想着等马斯克和川大大闹掰了趁机上位 才没心思管自己后院有没有起火呢
g
goodluckall
回复 13楼 helloterran4 的帖子
qwen是什么
h
helloterran4
goodluckall 发表于 2025-04-12 22:37
回复 13楼 helloterran4 的帖子
qwen是什么

qwen就是阿里的千问系列模型
上个月推出的qwq-32b,在一张GPU上能够放下的大模型中属于断崖式领先的存在。
一个用户
shzshtchjl 发表于 2025-04-12 21:32
上周公司内部就有国人工程师爆出了此事,并提上了辞职报告

赶紧让拍板的领导出来走两步。。。胆子这么大,不会是那谁吧
q
qlsdyxd1
有link吗?
g
goodluckall
回复 17楼 helloterran4 的帖子
谢谢,那美国AI崩了啊
一个用户
goodluckall 发表于 2025-04-12 22:51
回复 17楼 helloterran4 的帖子
谢谢,那美国AI崩了啊

美国强的都没有开源
s
shjzxz
Nizhenda 发表于 2025-04-12 10:26
上周meta 发布的llama 4 模型被发现其训练数据存在海量“题库”内容,属于特供版,现有排名已经被lmsys撤下,重新评估后其排名跌倒了32, 低于一年前发布的llama 3。
公司gen ai 部门领导周末召开了紧急会议,决定不把此事定位0级事故(sev0).
至于由谁和如何把次消息告知扎克伯格,并避免他在下周公司举办的fireside chat论坛和微软CEO satya nadella 交谈过程中出丑,众vp们仍旧一筹莫展。

不需要 sev0, sev23 就可以了
a
angelamela
歪个楼,各位没人觉得GPT-4o变笨了吗?跟年初相比。我觉得他回答问题越来越智障了,现在在强凹亲密感掩盖降智真相。
z
zelda
天呐,真的假的?
H
Harenough
千问有没有开源?
和chatgpt 比起来如何?
m
mfc
这绝对是不懂science的人瞎胡闹当leader的结果 不知道老中Scientist会不会推出来背锅。