Meta 上周发布的Llama 4 模型排名被撤，新排名落后于Llama 3 - 2025年4月13日北美华人网存档

5 个月

楼主 (北美华人网)

上周meta 发布的llama 4 模型被发现其训练数据存在海量“题库”内容，属于特供版，现有排名已经被lmsys撤下，重新评估后其排名跌倒了32, 低于一年前发布的llama 3。
公司gen ai 部门领导周末召开了紧急会议，决定不把此事定位0级事故（sev0).
至于由谁和如何把次消息告知扎克伯格，并避免他在下周公司举办的fireside chat论坛和微软CEO satya nadella 交谈过程中出丑，众vp们仍旧一筹莫展。

hankzhang

5 个月

他老婆会不会在这里看到

一

一个用户

5 个月

买它妹们情何以堪啊

bjeam

5 个月

回复 1楼 Nizhenda 的帖子
正好有个借口继续裁人。这个垃圾公司除了裁人也没别的招

Kubo

5 个月

小扎又要发脾气了

一

一个用户

5 个月

Kubo 发表于 2025-04-12 20:36
小扎又要发脾气了

这个事情换谁都要发脾气啊

aegeanboat

5 个月

不是sev 0，也是个sev 2吧

goodluckall

5 个月

小扎还不知道？

Kubo

5 个月

goodluckall 发表于 2025-04-12 20:54
小扎还不知道？

老大一般都是最后一个知道的

一

一个用户

5 个月

goodluckall 发表于 2025-04-12 20:54
小扎还不知道？

re 小札必须时刻关注这个排名，lol

youdai

5 个月

惨不忍睹，即便作弊还不如同行早出的模型，meta可以彻底歇菜，卖卖广告得了。开源的大旗让中国公司来扛

helloterran4

4 个月

Nizhenda 发表于 2025-04-12 10:26
上周meta 发布的llama 4 模型被发现其训练数据存在海量“题库”内容，属于特供版，现有排名已经被lmsys撤下，重新评估后其排名跌倒了32, 低于一年前发布的llama 3。
公司gen ai 部门领导周末召开了紧急会议，决定不把此事定位0级事故（sev0).
至于由谁和如何把次消息告知扎克伯格，并避免他在下周公司举办的fireside chat论坛和微软CEO satya nadella 交谈过程中出丑，众vp们仍旧一筹莫展。

华人大妈还没有意识到，这基本上奠定了大模型竞赛的胜负
llama出局，意味着全世界所有信息敏感的行业，本地部署的大模型只剩下两个选择：
deepseek和qwen
属于是杭州内战了。

shzshtchjl

4 个月

上周公司内部就有国人工程师爆出了此事，并提上了辞职报告

COHomeSearch

4 个月

小扎现在只想着等马斯克和川大大闹掰了趁机上位才没心思管自己后院有没有起火呢

goodluckall

4 个月

回复 13楼 helloterran4 的帖子
qwen是什么

helloterran4

4 个月

goodluckall 发表于 2025-04-12 22:37
回复 13楼 helloterran4 的帖子
qwen是什么

qwen就是阿里的千问系列模型
上个月推出的qwq-32b，在一张GPU上能够放下的大模型中属于断崖式领先的存在。

一

一个用户

4 个月

shzshtchjl 发表于 2025-04-12 21:32
上周公司内部就有国人工程师爆出了此事，并提上了辞职报告

赶紧让拍板的领导出来走两步。。。胆子这么大，不会是那谁吧

qlsdyxd1

4 个月

有link吗？

goodluckall

4 个月

回复 17楼 helloterran4 的帖子
谢谢，那美国AI崩了啊

一

一个用户

4 个月

goodluckall 发表于 2025-04-12 22:51
回复 17楼 helloterran4 的帖子
谢谢，那美国AI崩了啊

美国强的都没有开源

shjzxz

4 个月

Nizhenda 发表于 2025-04-12 10:26
上周meta 发布的llama 4 模型被发现其训练数据存在海量“题库”内容，属于特供版，现有排名已经被lmsys撤下，重新评估后其排名跌倒了32, 低于一年前发布的llama 3。
公司gen ai 部门领导周末召开了紧急会议，决定不把此事定位0级事故（sev0).
至于由谁和如何把次消息告知扎克伯格，并避免他在下周公司举办的fireside chat论坛和微软CEO satya nadella 交谈过程中出丑，众vp们仍旧一筹莫展。

不需要 sev0， sev23 就可以了

angelamela

4 个月

歪个楼，各位没人觉得GPT-4o变笨了吗？跟年初相比。我觉得他回答问题越来越智障了，现在在强凹亲密感掩盖降智真相。

zelda

4 个月

天呐，真的假的？

Harenough

4 个月

千问有没有开源？
和chatgpt 比起来如何？

mfc

4 个月