李飞飞花20元26分钟造出新模型 媲美DeepSeek

今日头条
Toutiao
最新回复:2025年2月12日 10点45分 PT
  返回列表
62656 阅读
46 评论
星岛日报



美籍华裔科学家李飞飞,仅用20美元和26分钟,便创出新的AI模型,效能媲美Deepseek、OpenAI。路透社

中国低成本高效的AI模型DeepSeek,推出后震撼科技界后,有AI教母之称的美籍华裔科学家李飞飞,率领其团队仅花了20美元及26分钟,便创造出一个「s1」的AI推理模型,表现媲美OpenAI o1和DeepSeek R1等尖端推理模型。

  仅用16块H100 GPU训练

综合外媒报道,李飞飞是史丹福大学首位红杉讲席教授,美国国家工程院院士。她与史丹福大学和华盛顿大学的研究团队,在一个月内便研发出s1模型,因像DeepSeek一样并非从零开始。s1是以阿里巴巴的通义千问Qwen2.5 -32B-Instruct开源模型为底座,在16块辉达(NVIDIA)H100 GPU上监督微调26分钟,训练出新模型。



美籍华裔科学家李飞飞有「AI教母」之称。@drfeifei



李飞飞是史丹福大学首位红杉讲席教授。Stanford University

  表现媲美OpenAI o1及DeepSeek R1

报道指,李飞飞团队在研究中提出了「预算控制」策略,透过加入「wait指令」等方式,强制延长模型推理过程、思考时间,以此促使模型自我检查并修正错误的推理步骤,提升推理品质。

根据李飞飞等人的研究论文《s1:Simple test- time scaling》,该模型在数学和编码能力测试中的表现,可媲美OpenAI的o1,以及DeepSeek的R1等尖端推理模型,在竞赛数学问题上更较o1-preview高出27%。

内媒每日经济新闻报道,复旦大学计算机学院副教授郑骁庆受访时表示:「像DeepSeek或类似的公司,在寻找有效的整合解决方案时,需要进行大量的前期研究与消融实验。」这意味著前期是需要大量「烧钱」的。

由于s1是基于现成模型进行监督微调,而微调一个模型和从零开始训练一个模型的成本是无法相提并论的。其次50美元是否包含了其他数据、设备和消融实验等费用,如DeepSeek-V3不到600万美元的训练成本,其实也只包含了训练时的GPU算力费用。

G
GoldenEar
1 楼
一个比一个厉害!就看客户如何使用了!哪个好用就用哪个!这个无需比较!
d
dada2023
2 楼
李飞飞研发出s1模型,是以阿里巴巴的通义千问开源模型为底座,阿里, 牛!
竞选
3 楼
既然只花20元就造出了模型,那向用户收费就不能太高,否则,用户就会指责你太贪婪。
城头散仙
4 楼
所以今後AI的發展空間,就在于在開源的基礎上用很少的錢,快速訓練出很多小的模型,然後在上面開發APP。砸大價錢去建立Data Center, train large model的方式已經走到頭了,Model Inference 會越拉越便宜,芯片價格自然會下跌。
弯刀月
5 楼
逼着中国出倒给钱的AI
C
Capitaltwo
6 楼
DeepSeek引领AI新潮流。openai白买了那么多gpu芯片雇了那么多阿三浪费了那么多钱。
总是我
7 楼
城头散仙 发表评论于 2025-02-11 16:44:11 所以今後AI的發展空間,就在于在開源的基礎上用很少的錢,快速訓練出很多小的模型,然後在上面開發APP。砸大價錢去建立Data Center, train large model的方式已經走到頭了,Model Inference 會越拉越便宜,芯片價格自然會下跌。 --------------- 没有那些大价钱的data center建立起来的大模型,李菲菲的小模型从何而来?
总是我
8 楼
Capitaltwo 发表评论于 2025-02-11 17:05:59 DeepSeek引领AI新潮流。openai白买了那么多gpu芯片雇了那么多阿三浪费了那么多钱。 ----------------- 是啊,openai的gpu都为deepseek服务了。
T
TitaniumAtlas
9 楼
哈哈哈哈,都跟着DS学会了偷,而且越偷越顺手
D
Ddco2021
10 楼
16块H100只需要20元?
c
cacu
11 楼
你一张嘴说媲美 算老几
b
bluetag
12 楼
只有OpenAI是真正从0到1做出来的,其他什么DS就是抄抄作业,当然是越抄越便宜,越来越不值钱。在这个行业,只有革命性的突破才是有意义的。
k
kl3527
13 楼
这些胡说八道的媒体分不清实验室的模型和真正运行的应用。在经过层层无知小编添油加醋,5分钱就可以造出航天飞机了。
总是我
14 楼
零元购逛了一圈苹果商店后笑话苹果,你造一个手机花了几百块,我只用了成本一块钱的购物袋就装来一大堆。
宝刀屠龙
15 楼
Capitaltwo 发表评论于 2025-02-11 17:05:59 DeepSeek引领AI新潮流。openai白买了那么多gpu芯片雇了那么多阿三浪费了那么多钱。 ========================================== 这和吃第7块烧饼饱了一样,为什么要浪费吃前6块,明明第7块就是吃饱的那个 无论是deepseek还是s1,都是蒸馏,没有大池子你从哪里蒸 chatgpt这种从挖土,做模开始,烧砖,烧瓦,做干墙,。。。盖个房子最终花了1万块 deepseek把chatgpt烧好的砖瓦拿来盖房子花了100块,李飞飞建个房子花了30块 于是沙壁们开始嘲笑chatgpt浪费
糖醋鲤鱼
16 楼
脑残狗粮们说这是偷窃,那为啥openai不起诉ds?openai就不拿别家公司的蒸馏数据了?你去查查openai有多少版权纠纷?
糖醋鲤鱼
17 楼
实际上美国这些添加ai模型成本本来就是泡沫,中国的DS只不过戳破了这个泡沫扒下来欧美ai公司的底裤而已。。。
糖醋鲤鱼
18 楼
中国的DS敢把自己的训练模型开源,你openai敢做的的么,呵呵
T
TitaniumAtlas
19 楼
五毛狗以为没被人抓住就不算偷?
T
TitaniumAtlas
20 楼
违反用户协议这一条就可以告了,只是成本收益相比不划算,毕竟ds把偷来的东西免费送给大家,赢了官司把开源给禁掉?
b
bluetag
21 楼
Open AI不是不告DS,而是要找好的时机,现在DS是免费的,你告他也陪不了几个钱,得不偿失,等到DS养肥了再告他不迟,目前DS所有的钱都在中国,你到中国去告肯定告不赢,在美国告赢了也没法执行,但是只要把证据放着,未来总有机会。
M
Maori
22 楼
幾大AI巨頭花這麼多錢莫非是一个騙局?以後人人都花百元可以搞了嗎?
护国中将
23 楼
原来都是抄别人的作业,抄完以后竟然舔不知耻的说是自己的原创
L
Lisland_2013
24 楼
玩烂了
g
groogle
25 楼
所以说 deepseek就值20块 哪个团队浪费500万 哈哈哈
难为
26 楼
说明Deepseek贵了,同类只要20块。
寒冰精灵
27 楼
还是人脑便宜,和我对话不要钱。
只看不回贴1208
28 楼
都是蒸馏,没有好坏,对AGI影响极坏。
a
abcdaren
29 楼
AI百花齐放是好事!成本越低越亲民,李飞飞太给我们留美学人长脸啦:不是红朝有什么绝招,没有政治正确也能搞出东西来!蒸馏而已,没什么太高明的,DS一点就破去神话光环。。。
老李子
30 楼
不是50元吗?
X
XM25
31 楼
那是嘲讽ds
Q
QZ666
32 楼
哭晕在厕所的人,应该是OPENAI 投资者, 烧那么多钱, 回本时间要多少百年?
s
size0
33 楼
川普别抓她间谍就好。
d
direstrait
34 楼
什么玩意儿。
硅谷码工头
35 楼
这牛逼吹的。
硅谷码工头
36 楼
“李飞飞团队在研究中提出了「预算控制」策略,透过加入「wait指令」等方式,强制延长模型推理过程、思考时间” 这他妈笑晕在厕所里,做过软件的都有这个经验 当年修bug修不出来的时候就到处加wait指令 祈祷瞎猫碰死耗子能撞上。 这几万颗GPU的地方也能到处加wait指令啊? 妈呀 you can't teach old dog new tricks?
令胡冲
37 楼
这个人浅薄无聊,让人不齿。那是人家阿里Qwen模型训练的好,还是你那几分钟微调的功劳? 这个人完全不懂大模型。
i
iask
38 楼
这是在讽刺Deepseek花了500万去蒸馏,李飞飞证明其实做同款只需要20块26分钟。
令胡冲
39 楼
楼下,那种讽刺只能告诉别人她完全不懂DeepSeek做了什么。那叫露怯,是在反讽自己。
C
Californian
40 楼
令胡冲 发表评论于 2025-02-12 00:01:14 这个人浅薄无聊,让人不齿。那是人家阿里Qwen模型训练的好,还是你那几分钟微调的功劳? 这个人完全不懂大模型。 ======================================== 你懂?LOL?
w
wjhwsh
41 楼
夸张了吧,李飞飞也来抢风头,还是搞你的空间智能去吧,大模型不是你的专长
5
5AGDG
42 楼
说明了500万美元被贪污了499万多。。。
5
5mslj
43 楼
蒸馏技术炉火纯青
硅谷工匠
44 楼
李菲菲模型叫LBFBL, "Let the Bullet Fly a bit Longer"。 基本承认大家都在把预制模型当数据库用,test time compute就是中途换prompt?
5
5mslj
45 楼
昨天说deepseek值1500亿美元市值,等李飞飞用五毛钱蒸馏以后,deepseek就值1500了
湾区范儿
46 楼
这位女士的嘴越来越歪了。