AI 业要崩盘,伯克利老中团队仅用30刀复现DeepSeek核心技术

p
pufften
楼主 (北美华人网)
加州大学伯克利分校博士生潘家怡(Jiayi Pan)团队仅用了30美元
30美元复现奇迹 潘家怡团队突破性研究体现在:
 1. 极低成本:使用30亿参数小模型,总成本控制在30美元以内[6][22]
 2. 能力验证:在"倒计时"游戏中实现自验证和搜索能力,展示精确逻辑推导[6][19]
 3. 技术透明:完整开源代码与实验数据,揭示RL训练中基础模型质量、奖励机制等关键参数影响[6][33] 
4. 泛化可能:证明推理能力可迁移至代码生成、医学诊断等领域[3][19] 目前已有港科大SimpleRL、HuggingFace OpenR1等十余个开源项目验证该技术路径[3][36]。

正如华尔街见闻指出,这种"30美元见证啊哈时刻"的现象,标志着AI研发正从资本密集型向智力密集型转变。
p
pufften
p
pufften
https://github.com/Jiayi-Pan/TinyZero
g
goodluckall
这可怎么办?Nvidia要跌到哪里去
b
boopy
果真是印证了那句话,这是一场在中国的华人和在美国的华人的对决
t
thatisnotright
回复 1楼 pufften 的帖子
如果能以既便宜的价格应用,堪称蒸汽机和电的发明。 为什么用‘崩’?石油1块钱的时候整个经济受用,也没见炼油厂倒闭。
S
Silverwing
回复 1楼 pufften 的帖子
如果能以既便宜的价格应用,堪称蒸汽机和电的发明。 为什么用‘崩’?石油1块钱的时候整个经济受用,也没见炼油厂倒闭。
thatisnotright 发表于 2025-02-03 01:22

大家都知道AI科技不会崩 崩的是泡泡一样的股价 NVDA大部分惊世骇俗的成果都是在它们股价低于30美元之前做的
股价崩不代表他们会倒闭
这是开玩笑的假新闻还是真的?旁边两大佬还在打架争谁家的宝贝更值钱呢,旁边一看热闹的nobody说别打了,你家那宝贝我家多的是,你要的话白送!
t
thatisnotright
回复 7楼 Silverwing 的帖子
他说AI业要崩,完全不对。 只能说以NVDA带头的几个chip公司‘可能’会跌,而且事实该跌的已经跌过了,还要怎么样?
l
layjohns
thatisnotright 发表于 2025-02-03 01:33
回复 7楼 Silverwing 的帖子
他说AI业要崩,完全不对。 只能说以NVDA带头的几个chip公司‘可能’会跌,而且事实该跌的已经跌过了,还要怎么样?

AI业不会崩,技术还是实打实的,崩的是估值,屁大点AI公司动不动几十上百成千亿美元估值,泡泡也太大了
f
facet
pufften 发表于 2025-02-03 01:18
加州大学伯克利分校博士生潘家怡(Jiayi Pan)团队仅用了30美元
30美元复现奇迹 潘家怡团队突破性研究体现在:
 1. 极低成本:使用30亿参数小模型,总成本控制在30美元以内[6][22]
 2. 能力验证:在"倒计时"游戏中实现自验证和搜索能力,展示精确逻辑推导[6][19]
 3. 技术透明:完整开源代码与实验数据,揭示RL训练中基础模型质量、奖励机制等关键参数影响[6][33] 
4. 泛化可能:证明推理能力可迁移至代码生成、医学诊断等领域[3][19] 目前已有港科大SimpleRL、HuggingFace OpenR1等十余个开源项目验证该技术路径[3][36]。

正如华尔街见闻指出,这种"30美元见证啊哈时刻"的现象,标志着AI研发正从资本密集型向智力密集型转变。

恰恰说反了,人工智能要全面开花大爆发了
f
facet
boopy 发表于 2025-02-03 01:22
果真是印证了那句话,这是一场在中国的华人和在美国的华人的对决

Our Chinese vs your Chinese
半个马和甲
又见RL....
想当年狗家写的另外的一个paper 的产物。
嗯。 坐等吃瓜。
h
heyykitty0
AGI以后就是基建的一部分,水电煤一样的存在。
g
ganymede
30刀?不至于吧,这也就能买个键盘
f
feifeiduan
如此人才Meta和Open AI里要是有还用弄什么司令部茶水间里帖标语,一天一个参数啊…..
m
minqidev
恰恰说反了,人工智能要全面开花大爆发了
facet 发表于 2025-02-03 01:40

是之前,一些已经推高的股价。 星际之门的意义是,用5000亿美元,提高AI的门槛,然后全世界的AI投资者都不和中国玩。
而且大家都在玩概念。这5000亿,可能绑定的是1000-2000亿美元,期望是以后赚5000亿。这个钱可能已经放到股市了。要知道,资本家一般和政治家联动的,这也就是议会经常产生股神的原因。 假设,这1000-2000亿美元已经进去了。原本,靠股价,期望应该是半年之内就应该出手。但是deepseek完全打乱了这个部署,再考虑到为了借这个钱支付的高额利息,亏得可能不少,这1000多亿都要打水漂。
以前,政治家玩概念,媒体控制舆论,资本家股市收割,是个完美的闭环。 但是,中国这次没有玩媒体,直接来了一个开源,然后把国内的量化公司推出去。形成了反收割。
将来股市,肯定是散户不停的买看上去到底的英伟达和芯片股票,但是会发现,总会被收割的。因为中国的量化资本已经出去了。 这些量化资本,就和以前的tiktok还有,大疆一样。他们是在国内优胜劣汰出来的,靠产业链和制造业来影响股价。和国外的量化资本还在靠新闻还操纵,基本上就是降维打击。
以前,大家总是觉得,中国制造业,中国的教育业,中国的软件业都崛起了。但是大家从未想过,中国的资本领域,也在国内的内卷中,升级了。
m
manyworlds
真棒,喷DS的继续喷吧,但DS点的这把火是熊熊燃烧了 LOL
h
homemmmjjj
layjohns 发表于 2025-02-03 01:38
AI业不会崩,技术还是实打实的,崩的是估值,屁大点AI公司动不动几十上百成千亿美元估值,泡泡也太大了

AI公司的泡泡,没有chip公司的泡泡大
m
minqidev
AI公司的泡泡,没有chip公司的泡泡大
homemmmjjj 发表于 2025-02-03 05:16

应该快破了。因为,之前AI的鸿沟似乎比光刻机要大得多。 之前,对中国AI得定义是,永远也出不了类似OpenAI得公司。
光刻机中国都有,只是EUV要花点时间而已。
S
Supersinger
30刀包括什么?买个2手电脑也不止这个价。
I
Iwkhx
pufften 发表于 2025-02-03 01:18
加州大学伯克利分校博士生潘家怡(Jiayi Pan)团队仅用了30美元
30美元复现奇迹 潘家怡团队突破性研究体现在:
 1. 极低成本:使用30亿参数小模型,总成本控制在30美元以内[6][22]
 2. 能力验证:在"倒计时"游戏中实现自验证和搜索能力,展示精确逻辑推导[6][19]
 3. 技术透明:完整开源代码与实验数据,揭示RL训练中基础模型质量、奖励机制等关键参数影响[6][33] 
4. 泛化可能:证明推理能力可迁移至代码生成、医学诊断等领域[3][19] 目前已有港科大SimpleRL、HuggingFace OpenR1等十余个开源项目验证该技术路径[3][36]。

正如华尔街见闻指出,这种"30美元见证啊哈时刻"的现象,标志着AI研发正从资本密集型向智力密集型转变。

几千亿的GPU哗哗的贬值。本来以为有米荒,高价屯米准备套利。现在出来了一个叫小麦的东西,便宜管够。哭晕!
G
GoNoGo
喜闻乐见,喜大普奔
s
suwa
拼多多模式。
y
yunhao
boopy 发表于 2025-02-03 01:22
果真是印证了那句话,这是一场在中国的华人和在美国的华人的对决

我觉得这是一场在美国华人和中国华人的共赢,共同把AI平民化,应用化
s
shanggj
ganymede 发表于 2025-02-03 02:37
30刀?不至于吧,这也就能买个键盘

团队成员 加班点个外卖, 都不太够呀。
s
shanggj
回复 2楼 pufften 的帖子
这个不是类似凑24吗? 为什么叫 countdown?
x
xiaoyao0401
数学里经常有构造函数来解题,普通人看了构造函数几分钟就解完了以为自己也行,但怎么千丝万缕中构造出那个函数别人不会告诉你
O
OLOAHA
又是博眼球的自媒体文章。原paper作者做了个精简的LLM模型,验证了LLM在某些特定应用下的推理过程,作者花了30刀租服务器来做实验。这种精简的模型对于特定领域应用可以节省算力,但不能像chatgpt和deepseek的完整模型那样上知天文下知地理中通python c++。

d
dodgers
目前R1的30亿参数小模型,恐怕在general事情上,效果不是很好。
如果运行R1 600B+参数的模型,需要几千美元或者上万美元的硬件,效果还是很好的。单人机器来说,估计也能用。
但成本是下降很多。未来的问题是,R1会到R2, training成本还是有的,是否一直开源?
k
kano_hina
刺破泡沫之后才能真正成长,都是这样的
j
jerrylancer
消费者乐见其成,长期看是利好
c
custom
boopy 发表于 2025-02-03 01:22
果真是印证了那句话,这是一场在中国的华人和在美国的华人的对决

应该是全体华人对决其他
J
Jaelynleaf
将来还是能源之战
j
jiangyoudang17
为啥会崩盘?你又不是去投机炒作的。正常情况下,投入成本大幅度降低,对普通人是好事啊
y
yainju
回复 1楼 pufften 的帖子
奥特曼承认自己站在了历史的错误一边,看来也不是谦虚啊。开源,低价,是大势所趋
痘痘猪
这$30干什么用的? 不会是在chat gpt上 开个api调用token 的成本吧
平明寻白羽
ganymede 发表于 2025-02-03 02:37
30刀?不至于吧,这也就能买个键盘

是租用H100 GPU的费用。
countdown game是很简单的问题,只是用来验证deepseek r1-zero的核心算法,就是RL实现AI自我学习自我纠正寻找答案的过程。 所以算力需求不大,30刀够了。
主旨在重现算法带来的那个aha moment.