AI精灵破瓶而出?伯克利大学30美元复现deepseek

老键
楼主 (文学城)

记得是阿拉伯的神话吧,一个神秘的精灵被封印在瓶子里,直到某天被人不慎人释放出来,从此搞得世界天翻地覆。类似的事情似乎正在AI界发生,据这篇文章介绍https://xyzlabs.substack.com/p/berkeley-researchers-replicate-deepseek,最近加州大学伯克利分校的中国博士生Jiayi Pan带头的团队让人惊掉下巴,他们用区区 30 美元,就成功复现了 DeepSeek R1-Zero 模型的核心技术。据说这个团队用的是一个较小的模型,和一些超级聪明的训练方法来提高它的解题能力,虽然具体方法没有公开,但从最终效果看实验非常成功。

如果属实,这意味着什么同志们啊?!这可是以前只有超级大厂才能玩的玩意儿,没有几千万资金休想跨过门槛。

Deepseek声称训练成本只有chatgpt模型的几十分子一,然而伯克利竟然几乎无成本复现了它的核心技术, 魔瓶被打开了,一个AI精灵已破瓶而出,无人能再把它塞回去。当更多的独立研究者、初创公司,甚至业余爱好者也开始搭建自己的 AI 模型,世界会怎样变化?



更多我的博客文章>>> AI精灵破瓶而出?伯克利大学30美元复现deepseek Deepseek 风暴 澳洲国庆日小照 川普二婚,蜜月期就免了吧 川普就任花絮两则
陶陶三
玩呗,老键没听古诗说的,生年不满百,常怀千岁忧。
d
donau
那您意思是大家排队唱离骚然后找条河一个猛子扎进去?
陶陶三
我觉得让AI给咱包个粽子比较好,不好吃不给电。
波粒子3
看了DS的原代码吧
老键
满百还忧什么,再说咱这是忧吗?完全呼应我上篇博文的upbeat和新年社论

上篇咱说 "但技术性能还不是关键,科技进步总是后浪高过前浪,关键是deepseek取得这样傲人的性能据报只用了chatgpt几十分子一的成本,包括数量级减少的用于语言大模型学习的图像处理器数目和能耗,这是十分惊人的, 如chatgpt的早期版本,deepseek大方公开了源码,如果实力雄厚的大公司用资金,算力和人才杠杆撬动进一步开发,其成果将难以预料,其一;其二,它模型训练的廉价,极大降低了应用的门槛,譬如某家民间网调公司可以下载它的开码,适化后在一架laptop上就能训练特定领域的用户信息,而无需云计算。所以,虽然目前的deepseek 并不代表重大的生产力意义上的突破,但它打开的这扇窗,一下让人看到远得多宽得多的前景。"

新年社论咱说:"AI方面其实科技界已经为此做足了心理准备,包括2024的诺贝尔物理学奖,只是很多技术讯息还不便或者无法有效向社会传达。AI不会征服人类,但会通过改变人类的认知过程而让人类的角色发生巨大改变,AI成为人类的主要生产力应该为期不远。"

陶陶三
生年不满百,常怀千岁喜。
老键
看来不假,潘同学自己的X

https://x.com/jiayi_pirate/status/1882839370505621655

 

f
freemanli01
三十美元?请民工打磨芯片Logo 就用完了。都是没边没盐开始放卫星了。
f
freemanli01
PAI, personal AI.
f
freemanli01
记得当年elon 跟马云对话,翼龙问听说中国字里AI就代表爱,马云不知道是不是没学过拼音,当时是完全没反应啥意思。。。
木有文化
我倒是觉得这个 $30 AI 突破没有那么大的影响
老键
30美元哪请得到民工
老键
那个核心模型的理论,也不见得是deepseek首创,或早有别人的论文,科技发展彼此互为台阶很正常,加以承认就行
老键
我指望手机AI时代,去欧洲旅游,摄像头360度一扫,哪有扒手,恐怖分子,陶三,多瑙,古纸,一目了然
d
donau
哎呀那多谢老键抬举我们太荣幸了我们几个能跟扒手恐怖分子站一排从来没敢有这么高的理想啊。多谢多谢真是无以为报啊
A
AP33912
老健,俺不懂这个语言啊,这个小潘同学好像只用了一个GPU?(那也不止$30啊,租一个小时上$30还差不多:))