Meta 周末发布了(llama 4)系列模型,包括全球排名第二的(Llama Behemoth) 版本

s
shzshtchjl
楼主 (北美华人网)
Meta集团于本周末胜利完成草泥马 4(Llama 4)系列大模型的研发与发布工作。其中,参数量最大的版本(Llama Behemoth) 内部测试表现为全球大模型排行第二。
周六,扎克伯格在DC通过Instagram 和 Facebook 两大平台对全公司发表了讲话。讲话指出,这一重大成果是Meta全体技术人员战士在四大“Llama作战室” (llama war room) 中团结拼搏、日夜奋战的结果。体现了公司“集中力量办大事”,(pooling our resources and making big impact)的体制优势, 发扬了公司“分秒必争,砥砺前行”(move fast and break things) 的精神。
据悉,Llama 4模型的诞生历经了内部激烈技术路线斗争。面对是否采用国外AI企业"深度求索"(Deepseek)的"混合专家架构"(MoE),Meta技术委员会一度陷入“思想不统一”的困境。关键时刻,扎克伯格以“技术无国界"的胸怀,拍板引进并改进了国外先进技术,成功落实了具有美国特色的MoE架构 。
目前,Llama Behemoth以微弱优势暂居全球大模型排行榜第二位,Meta宣传部门称此为历史性突破。但随着OpenAI、谷歌及国外deepseek新一代模型的部署,Llama排名有可能再次下滑。据悉,公司马不停蹄,Llama 5的研发工作正在紧锣密鼓地展开。
https://www.reuters.com/technology/meta-releases-new-ai-model-llama-4-2025-04-05/


D
Dadaobz
we just need
ONE bot to rule them all!
h
hrNetworkId_123
“Meta技术委员会一度陷入“思想不统一”的困境。关键时刻,扎克伯格以“技术无国界"的胸怀,拍板引进并改进了国外先进技术,成功落实了具有美国特色的MoE架构 。
高屋建瓴高瞻远瞩式抄作业
一个用户
小扎也专门提到了和google,openAI,deepseek的比较。
明天Meta股票大涨????
b
bestcici
发现了个规律就是唯我白皮所用时,天南地北怎么说都是对!!! 唯黄皮产出时,不是偷和强,就是危害国家的安全!发现长期洗脑后,人会加速偏执和脱离真实世界中....
o
olivia0216
“Meta技术委员会一度陷入“思想不统一”的困境。关键时刻,扎克伯格以“技术无国界"的胸怀,拍板引进并改进了国外先进技术,成功落实了具有美国特色的MoE架构 。
高屋建瓴高瞻远瞩式抄作业
hrNetworkId_123 发表于 2025-04-06 10:54

引进国外先进技术。。。时代果然不同了
j
jeso1
驴脸杂脖哥吃翔都赶不上热乎的。
G
Geofan
好像已经翻车了
y
yurik
MoE又不是DS发明的,还引进?这些中文媒体的特征就是莫名其妙地带节奏,忽悠不懂的人。 客观地说,这次没有发布reasoning模型,并且最小的参数都比较大,很难在commodity hardware上运行,指标也没全面达到开源SOTA(有的重要eval数据集大概是因为分数不好看甚至都没有直接公布),是让业界失望的几个地方。唯一的亮点是10M长context window,但要看实际应用中效果好不好,多模态能力也许能再算半个。
w
weiyixia
之前不是要抓那个透露meta挑灯夜读抄 deepseek code的人吗?找到了没?
一个用户
weiyixia 发表于 2025-04-06 12:53
之前不是要抓那个透露meta挑灯夜读抄 deepseek code的人吗?找到了没?

网上说裁了一批偷偷报账揩油的。泄密的事儿没有下文。