脸书母公司Meta已成立了4个专门研究小组来研究量化巨头 「幻方量化」旗下的大模型DeepSeek的工作原理

颜阳
楼主 (文学城)

Information报导,脸书母公司Meta已成立了4个专门研究小组来研究量化巨头「幻方量化」旗下的大模型DeepSeek的工作原理,并基于此来改进旗下大模型Llama。

据说DEEPSEEK并未公开其用于训练的数据库,

其中2个小组正在试图了解「幻方量化」如何降低训练和运行DeepSeek的成本;第3个研究小组则正在研究「幻方量化」可能使用了哪些资料来训练其模型;第4个小组正在考虑基于DeepSeek模型属性重构Meta模型的新技术。

 

 

C
CheGuevara
什么都不重要,重要的是open source will prevail的理念
芳华万里
that is the least important thing
未知
只要有人能做到出来,很快就会有他人复制和增强。ChatGPT 也是这样,即使是闭源的也挡不住
越王剑
This would be a bad news for NVDA

Meta, Amazon, MSFT all wants to have their own chips to reduce cost.

This will help them achive their goals fast which would be the bad news for NVDA, AVGO. But it is indeed good new for Meta, Amazon, MSFT whoever wants their own chips.

m
mobius
不错。工程上最难的就是证明可行,只要知道能弄出来,就是时间和金钱的事。AGI到现在还没影,严重怀疑现有的体系行不行
凊荷
这个是最重要的事
未知
True,至少短期是这样。NVDA是活的,不是死的,也会Adapt

AI发展的下一个大里程碑,就应该是 AGI / ASI。具体是什么情况,需要多少算力,用什么芯片,现在还是未知。

越挫越勇2
I second that.
c
cnrhm2017
No, deepsek shows asic would be bad idea
f
futufutu
现有的体系不行! AGI需要AI不断自我成长并与其他模型互动