斯坦福华裔科学家 50美元训练出媲美Deepseek模型

今日头条
Toutiao
最新回复:2025年2月6日 13点30分 PT
  返回列表
26406 阅读
40 评论
21世纪经济报道

据《科创板日报》消息,李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。

该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提炼出来的。

公开资料显示,李飞飞1976年生于北京的一个高级知识分子家庭,16岁时赴美求学。从2000年进入加州理工学院攻读研究生起,李飞飞一直从事人工智能研究,并于2005年获得电子工程博士学位。她在33岁时就成为斯坦福计算机系终身教授,44岁成为美国国家工程院院士。在计算机视觉这一领域还相当冷门的早期,李飞飞就选择了这个方向并持续耕耘,创立了ImageNet——一个拥有1500万张图片的数据库,成为人工智能计算机视觉研究的奠基之作。

据《证券时报》报道,李飞飞于2024年4月创办了World Labs(空间智能),正式从学者转型成为一名创业者。创办仅几个月,空间智能已在7月的一轮融资中筹集到了约1亿美元资金,估值突破10亿美元,晋升为又一AI独角兽。

据澎湃新闻报道,李飞飞曾在采访中提到,现在的AI比人类差远了,能耗高、体积庞大,而且尚未具备情感,但人类智慧可以启发下一代AI做得更好。

5
5mslj
1 楼
一个行业爆发的初期,大家蜂拥而至抢风口,妖魔鬼怪和各路神仙打架,让子弹再飞一会儿吧
t
touchlife
2 楼
中国人爱省钱的stereotype看来是没跑了,lol
老李子
3 楼
50元?怎么算出来的?
又一个无名氏
4 楼
李飞飞像是淘金热里卖铲子的,台湾政界里的王金平。
新桃换旧符168
5 楼
其实第一个chatgpt是最难的。后面的跟风也没什么意义啦。女人做科研最大的问题就是缺少创新。女人大都做事细致认真。可以不断update一个创新的idea,但是在科研领域,创新是很重要的一环。
有门部关
6 楼
亩产万斤不是梦。
令胡冲
7 楼
50元不可能,租一个最低档GPU虚拟机一天也要及时美元。买一个游戏GPU也得几百美元。不大可能。 蒸馏开源小模型是可能的。因为你可以对它Next token 预测的Softmax分布进行一些比较全面的采样。 但那个被蒸馏的模型都没有表现出足够推理功能。你蒸馏个小模型却有,而你又没花钱去训练它。这怎么可能。 李飞飞在噌热度。虽然也是华人。
体制内
8 楼
她半个小时的工资都不止50美元
Q
Q22
9 楼
女的好混。我朋友圈里,好几个男生也是美国名校博士 -伯克利,哈佛,John Hopkins, 等等。申请美国大学教职好多拿不到的,(语言,口音,形象等,被白男刷掉)。同样级别的名校博士,女的比男的好出头,好混。
令胡冲
10 楼
人间一切创新的意义全在于后面跟风的。 因为第一次发现往往是偶然现象,运气使然。但后面的人就必须能重复它,搞明白为什么如此,把它从运气升级到理论必然和工程必然。青霉素等抗生素就是这样的。 —————- 新桃换旧符168 发表评论于 2025-02-06 07:05:08 其实第一个chatgpt是最难的。后面的跟风也没什么意义啦。女人做科研最大的问题就是缺少创新。女人大都做事细致认真。可以不断update一个创新的idea,但是在科研领域,创新是很重要的一环。
硅谷工匠
11 楼
李飞飞怎么也堕落到什么热折腾什么的地步。
令胡冲
12 楼
另外李飞飞是华人教授,也应该说话慎重。别瞎扯淡太猛。 川总信了奥特曼,说五千亿我智能核爆,曼哈顿。话音未落,DeepSeek一帮小年轻说5百万就能让大模型智能涌现,豁然开朗。尘嚣未定又来个李飞飞,说50元就行。OK,川总是文科,但你这么甩他,他那么大年纪,也有面子吧?这么忽悠不好吧
新桃换旧符168
13 楼
DEI贻害万年,美国迟早毁在这些上面还有BLM woke什么的 Q22 发表评论于 2025-02-06 07:26:50女的好混。我朋友圈里,好几个男生也是美国名校博士 -伯克利,哈佛,John Hopkins, 等等。申请美国大学教职好多拿不到的,(语言,口音,形象等,被白男刷掉)。同样级别的名校博士,女的比男的好出头,好混。
c
ca_lowhand
14 楼
开卷了,支持
s
size0
15 楼
早说了,人工这块不是中国的就是美国华裔的。希望川建国不把李飞飞定成间谍。
g
groogle
16 楼
她吃了顿饭 就训练出来了 50块 如果碰巧是喝咖啡 更便宜
R
RomanticOnly
17 楼
这有点离谱了吧,bestbuy里面随便买个东西也不只50吧,难不成能用计算器训练吗?
文学城普通人
18 楼
蒸馏的成本和原始建模的成本根本就是两码事。想省钱就跟着别人后面干蒸馏好了,永远不会领先。 同意DEI的坏处。但是楼下强调男女差别是找不到教职的原因忽略了这些男生估计是没有什么公认过硬的成果,即使多发表几篇文章也实在不算什么大的差别,面试时候又不能最佳表现自己。国男找到教职的也多了去了,也没有每个都是俊男。
指鹿为马
19 楼
我可以不用花钱,做一个deepseek的链接,叫deepsick,马上取代deepseek。
小二哥李白
20 楼
这些团队所做的事情是独立验证DeepSeek论文里提出的一些有关低成本高效益的Claim并且公开发表,前几天柏克莱也有一个团队发表了成本$30的,这是学术界Peer Review的工作,没必要添油加醋上纲上线。
w
worley
21 楼
其实就是抄袭复制克隆人家ChatGPT。 创新的成本总是很高,剽窃的成本几乎为零。 整理、验证、购买高质量数据的成本需要几十亿美元,盗用的成本几乎为零。
m
man008
22 楼
过几天,就会有无毛跳出来说,我发条帖子就能训练出媲美Deepseek模型了。
b
bluetag
23 楼
这个也好,DS也好,都是跟在人家屁股后面,顶多就是有点商业价值,但没有技术价值,吹嘘成本更是笑话,创新和模仿的成本有可比性吗?
X
XM25
24 楼
这说明最伟大的是第一个。诺贝尔奖就是奖给原创。后面改进没什么好吹的。
O
Opa
25 楼
哼哼,吹牛逼吹的晚了
T
TitaniumAtlas
26 楼
蒸馏这事不禁止大公司都不愿意投资AI了,看你们还蒸馏谁去,总不能相互蒸馏吧
s
shamrock100
27 楼
参考了DS的开源算法?
w
wd01702
28 楼
50美元相当于一个普通码农的时薪。是不是吹过头了,还是对deepseek 的讽刺?你要说50美元是运算的电费还说得过去。
宝刀屠龙
29 楼
XM25 发表评论于 2025-02-06 09:15:00 这说明最伟大的是第一个。诺贝尔奖就是奖给原创。后面改进没什么好吹的。 ========== LLM只能是OpenAI,其他都是徒子徒孙
s
supernova13
30 楼
"据澎湃新闻报道,李飞飞曾在采访中提到,现在的AI比人类差远了,能耗高、体积庞大,而且尚未具备情感" 这句话不太对,AI的概念大于机器人概念,所以个头大小,是否具备情感并非目前的主要考虑,也非AI的无限潜力和附带的危险所在。
s
supernova13
31 楼
前几天伯克利一个团队用30美元重复了DeepSeek的算法,如果斯坦福也是使用DS的算法,那DeepSeek应该得大奖。
o
o88
32 楼
风口上谁都不甘寂寞。
纷纷
33 楼
复制、抄袭、蒸馏……,省钱、省时、省力。厉害了!
T
TitaniumAtlas
34 楼
造楼下的说法发明电诈的台湾人也得得大奖啊
不好吃懒做
35 楼
李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型 - 哇!!!这50元怎么花的?
l
ljcn
36 楼
蒸馏法又不是DS团队首先提出的?他们首先搞了500万美元的噱头而已。人家只是照着这个思路去打你的脸。 supernova13 发表评论于 2025-02-06 10:22:23 前几天伯克利一个团队用30美元重复了DeepSeek的算法,如果斯坦福也是使用DS的算法,那DeepSeek应该得大奖。
G
GoldenEar
37 楼
人家DS提供了免费开源的人工智能,和电信诈骗天壤之别!别胡乱比较吧! ------------------------ TitaniumAtlas 发表评论于 2025-02-06 11:45:38造楼下的说法发明电诈的台湾人也得得大奖啊
G
GoldenEar
38 楼
电诈骗害人不浅!估计你是来自于台湾吧!呵呵呵 ------------------------------------------------- TitaniumAtlas 发表评论于 2025-02-06 11:45:38造楼下的说法发明电诈的台湾人也得得大奖啊
A
AreyouOK?
39 楼
初始的感觉是梁shorted NVDIA by his news on Monday for the big gain. Money is the king.
s
supernova13
40 楼
@ljcn, 蒸馏法一种模型压缩技术,当然不是DS提出的,别人也用(但有人却以此为理由污蔑DS抄袭!)。 DS取得突破的关键在于算法,其核心思想是通过一个辅助模型来加速大模型的推理,这样,大模型不需要逐步生成每个token(字或字的一部分),而是可以批量验证多个token,从而大幅提升推理速度。 ================================ ljcn 发表评论于 2025-02-06 12:03:44 蒸馏法又不是DS团队首先提出的?他们首先搞了500万美元的噱头而已。人家只是照着这个思路去打你的脸。