AI精灵破瓶而出？伯克利大学30美元复现deepseek - 2025年2月3日文学城存档

大约 22 小时

楼主 (文学城)

记得是阿拉伯的神话吧，一个神秘的精灵被封印在瓶子里，直到某天被人不慎人释放出来，从此搞得世界天翻地覆。类似的事情似乎正在AI界发生，据这篇文章介绍https://xyzlabs.substack.com/p/berkeley-researchers-replicate-deepseek，最近加州大学伯克利分校的中国博士生Jiayi Pan带头的团队让人惊掉下巴，他们用区区 30 美元，就成功复现了 DeepSeek R1-Zero 模型的核心技术。据说这个团队用的是一个较小的模型，和一些超级聪明的训练方法来提高它的解题能力，虽然具体方法没有公开，但从最终效果看实验非常成功。

如果属实，这意味着什么同志们啊？！这可是以前只有超级大厂才能玩的玩意儿，没有几千万资金休想跨过门槛。

Deepseek声称训练成本只有chatgpt模型的几十分子一，然而伯克利竟然几乎无成本复现了它的核心技术，魔瓶被打开了，一个AI精灵已破瓶而出，无人能再把它塞回去。当更多的独立研究者、初创公司，甚至业余爱好者也开始搭建自己的 AI 模型，世界会怎样变化？

陶

陶陶三

大约 21 小时

玩呗，老键没听古诗说的，生年不满百，常怀千岁忧。

donau

大约 21 小时

那您意思是大家排队唱离骚然后找条河一个猛子扎进去？

陶

陶陶三

大约 21 小时

我觉得让AI给咱包个粽子比较好，不好吃不给电。

波

波粒子3

大约 21 小时

看了DS的原代码吧

老

老键

大约 21 小时

满百还忧什么，再说咱这是忧吗？完全呼应我上篇博文的upbeat和新年社论

上篇咱说 "但技术性能还不是关键，科技进步总是后浪高过前浪，关键是deepseek取得这样傲人的性能据报只用了chatgpt几十分子一的成本，包括数量级减少的用于语言大模型学习的图像处理器数目和能耗，这是十分惊人的, 如chatgpt的早期版本，deepseek大方公开了源码，如果实力雄厚的大公司用资金，算力和人才杠杆撬动进一步开发，其成果将难以预料，其一；其二，它模型训练的廉价，极大降低了应用的门槛，譬如某家民间网调公司可以下载它的开码，适化后在一架laptop上就能训练特定领域的用户信息，而无需云计算。所以，虽然目前的deepseek 并不代表重大的生产力意义上的突破，但它打开的这扇窗，一下让人看到远得多宽得多的前景。"

新年社论咱说："AI方面其实科技界已经为此做足了心理准备，包括2024的诺贝尔物理学奖，只是很多技术讯息还不便或者无法有效向社会传达。AI不会征服人类，但会通过改变人类的认知过程而让人类的角色发生巨大改变，AI成为人类的主要生产力应该为期不远。"

陶

陶陶三

大约 21 小时

生年不满百，常怀千岁喜。

老

老键

大约 21 小时

看来不假，潘同学自己的X

https://x.com/jiayi_pirate/status/1882839370505621655

freemanli01

大约 19 小时