记得是阿拉伯的神话吧,一个神秘的精灵被封印在瓶子里,直到某天被人不慎人释放出来,从此搞得世界天翻地覆。类似的事情似乎正在AI界发生,据这篇文章介绍https://xyzlabs.substack.com/p/berkeley-researchers-replicate-deepseek,最近加州大学伯克利分校的中国博士生Jiayi Pan带头的团队让人惊掉下巴,他们用区区 30 美元,就成功复现了 DeepSeek R1-Zero 模型的核心技术。据说这个团队用的是一个较小的模型,和一些超级聪明的训练方法来提高它的解题能力,虽然具体方法没有公开,但从最终效果看实验非常成功。
如果属实,这意味着什么同志们啊?!这可是以前只有超级大厂才能玩的玩意儿,没有几千万资金休想跨过门槛。
Deepseek声称训练成本只有chatgpt模型的几十分子一,然而伯克利竟然几乎无成本复现了它的核心技术, 魔瓶被打开了,一个AI精灵已破瓶而出,无人能再把它塞回去。当更多的独立研究者、初创公司,甚至业余爱好者也开始搭建自己的 AI 模型,世界会怎样变化?
上篇咱说 "但技术性能还不是关键,科技进步总是后浪高过前浪,关键是deepseek取得这样傲人的性能据报只用了chatgpt几十分子一的成本,包括数量级减少的用于语言大模型学习的图像处理器数目和能耗,这是十分惊人的, 如chatgpt的早期版本,deepseek大方公开了源码,如果实力雄厚的大公司用资金,算力和人才杠杆撬动进一步开发,其成果将难以预料,其一;其二,它模型训练的廉价,极大降低了应用的门槛,譬如某家民间网调公司可以下载它的开码,适化后在一架laptop上就能训练特定领域的用户信息,而无需云计算。所以,虽然目前的deepseek 并不代表重大的生产力意义上的突破,但它打开的这扇窗,一下让人看到远得多宽得多的前景。"
新年社论咱说:"AI方面其实科技界已经为此做足了心理准备,包括2024的诺贝尔物理学奖,只是很多技术讯息还不便或者无法有效向社会传达。AI不会征服人类,但会通过改变人类的认知过程而让人类的角色发生巨大改变,AI成为人类的主要生产力应该为期不远。"
https://x.com/jiayi_pirate/status/1882839370505621655
记得是阿拉伯的神话吧,一个神秘的精灵被封印在瓶子里,直到某天被人不慎人释放出来,从此搞得世界天翻地覆。类似的事情似乎正在AI界发生,据这篇文章介绍https://xyzlabs.substack.com/p/berkeley-researchers-replicate-deepseek,最近加州大学伯克利分校的中国博士生Jiayi Pan带头的团队让人惊掉下巴,他们用区区 30 美元,就成功复现了 DeepSeek R1-Zero 模型的核心技术。据说这个团队用的是一个较小的模型,和一些超级聪明的训练方法来提高它的解题能力,虽然具体方法没有公开,但从最终效果看实验非常成功。
如果属实,这意味着什么同志们啊?!这可是以前只有超级大厂才能玩的玩意儿,没有几千万资金休想跨过门槛。
Deepseek声称训练成本只有chatgpt模型的几十分子一,然而伯克利竟然几乎无成本复现了它的核心技术, 魔瓶被打开了,一个AI精灵已破瓶而出,无人能再把它塞回去。当更多的独立研究者、初创公司,甚至业余爱好者也开始搭建自己的 AI 模型,世界会怎样变化?
更多我的博客文章>>> AI精灵破瓶而出?伯克利大学30美元复现deepseek Deepseek 风暴 澳洲国庆日小照 川普二婚,蜜月期就免了吧 川普就任花絮两则
上篇咱说 "但技术性能还不是关键,科技进步总是后浪高过前浪,关键是deepseek取得这样傲人的性能据报只用了chatgpt几十分子一的成本,包括数量级减少的用于语言大模型学习的图像处理器数目和能耗,这是十分惊人的, 如chatgpt的早期版本,deepseek大方公开了源码,如果实力雄厚的大公司用资金,算力和人才杠杆撬动进一步开发,其成果将难以预料,其一;其二,它模型训练的廉价,极大降低了应用的门槛,譬如某家民间网调公司可以下载它的开码,适化后在一架laptop上就能训练特定领域的用户信息,而无需云计算。所以,虽然目前的deepseek 并不代表重大的生产力意义上的突破,但它打开的这扇窗,一下让人看到远得多宽得多的前景。"
新年社论咱说:"AI方面其实科技界已经为此做足了心理准备,包括2024的诺贝尔物理学奖,只是很多技术讯息还不便或者无法有效向社会传达。AI不会征服人类,但会通过改变人类的认知过程而让人类的角色发生巨大改变,AI成为人类的主要生产力应该为期不远。"
https://x.com/jiayi_pirate/status/1882839370505621655