求sam现在的心情, 李飞飞团队用了50刀后,斯坦福用了6刀

y
yuanyuanwhu
楼主 (北美华人网)
斯坦福大学以及华盛顿大学的研究团队展示了一种极低成本的 AI 训练方法,被称为 S1。S1 仅使用 6 美元就能达到 OpenAI o1-preview 级别的推理性能!同时匹敌Deepseek R1
y
yuanyuanwhu

④【李飞飞团队用不到50美元训练出媲美DeepSeek R1的AI推理模型】李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提炼出来的,使用16个英伟达H100 GPU进行了26分钟的训练。
g
gongyongmajia36
yuanyuanwhu 发表于 2025-02-06 16:14

④【李飞飞团队用不到50美元训练出媲美DeepSeek R1的AI推理模型】李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提炼出来的,使用16个英伟达H100 GPU进行了26分钟的训练。

NVDA还得接着跌?
w
westlake
这种科技进步,都是站在巨人的肩膀上,没有初期大投入大数据量的AI研发,也不会有后期做蒸馏的可能
这就像是吃烧饼,吃到第十个吃饱了,你能说前面九个都不该吃?
c
crazyHat
回复 4楼 westlake 的帖子
你这个例子不太恰当。主要问题是Close AI想卡着其他所有人的脖子赚大钱,现在落得一场空
此地无银三千两
这么说的话前面八个半的饼都是谷歌做出来的,大家不是一样嘲笑它怎么落后了吗
N
Namama

OpenAI下一步肯定是现有的闭源模型,进一步加强数据封锁,防止别人利用他的模型进行蒸馏啊。。
d
dahai008
crazyHat 发表于 2025-02-06 16:19
回复 4楼 westlake 的帖子
你这个例子不太恰当。主要问题是Close AI想卡着其他所有人的脖子赚大钱,现在落得一场空

一个私人公司怎么卡其他人?
p
pandacool
gongyongmajia36 发表于 2025-02-06 16:17
NVDA还得接着跌?

看来是。。。。。
s
sanguo9
一边鸡蛋通胀 这边ai通缩,赢嘛了
s
shunyi
Sam凉了吧?人品也不好,把技术大拿都给挤走了
N
Namama
dahai008 发表于 2025-02-06 16:24
一个私人公司怎么卡其他人?

原本说好完全开源的, 但等真研究出点东西后,却选择严格的闭源??
OpenAI现在还有啥东西是Open的??
p
pandacool
shunyi 发表于 2025-02-06 16:27
Sam凉了吧?人品也不好,把技术大拿都给挤走了

现在大家聚焦的是英伟达,老黄的股票
g
goodluckall
回复 3楼 gongyongmajia36 的帖子
我觉得女大还很有得跌,可是这几天它还一直涨
S
Salad777
sanguo9 发表于 2025-02-06 16:26
一边鸡蛋通胀 这边ai通缩,赢嘛了

这句话亮了,鸡蛋可以比肩AI了
L
Lalala2022
sanguo9 发表于 2025-02-06 16:26
一边鸡蛋通胀 这边ai通缩,赢嘛了

买鸡蛋的钱可以训练出ai了
g
gokgs
No surprise.
l
laixiaofang
westlake 发表于 2025-02-06 16:17
这种科技进步,都是站在巨人的肩膀上,没有初期大投入大数据量的AI研发,也不会有后期做蒸馏的可能
这就像是吃烧饼,吃到第十个吃饱了,你能说前面九个都不该吃?

问题是sam可不想只做巨人啊,人家想着赚大钱啊!
西
西北飘雪
yuanyuanwhu 发表于 2025-02-06 16:13
斯坦福大学以及华盛顿大学的研究团队展示了一种极低成本的 AI 训练方法,被称为 S1。S1 仅使用 6 美元就能达到 OpenAI o1-preview 级别的推理性能!同时匹敌Deepseek R1

早干啥去了?
s
sanguo9
Lalala2022 发表于 2025-02-06 16:32
买鸡蛋的钱可以训练出ai了

限购两盒,吃一盒,训练一盒
h
hrNetworkId_123
科技进步跟奥特曼毛关系没有, 此人捞钱就算了,还想着偷天换日,装大佬人设。离被抛弃不远了。,
b
bb5
预测明天的新闻: 某某团队用 五毛钱 就超过了 Deepseek + ChatGPT
简单
我觉得openAI应该很高兴听到这个。AI说不定真的要爆发了!
y
yangcongtou
回复 1楼 yuanyuanwhu 的帖子
超过deepseek,恐怕没那么容易
a
aiyamayayongle
我就好奇这50刀,6刀的开销是咋算出来的。编程的马工白干?
m
meraviglia
网上说李飞飞的 s1 模型是基于阿里的 QWEN 模型进行监督微调,只进行了上千个样本训练。
但这不还是QWEN 吗?
y
yuanyuanwhu
aiyamayayongle 发表于 2025-02-06 18:50
我就好奇这50刀,6刀的开销是咋算出来的。编程的马工白干?

当然白干,因为那是你正常的工作,你不干这个,就得去干那个工作
c
cheezit1999
bb5 发表于 2025-02-06 16:57
预测明天的新闻: 某某团队用 五毛钱 就超过了 Deepseek + ChatGPT

hahaha,别卷到以后不仅不要钱,train个AI还倒贴钱给咱 。
t
tingtinglee
DeepSeek 没事儿,证明人家那成本是可能的,openAI真是要哭晕了
f
facet
此地无银三千两 发表于 2025-02-06 16:19
这么说的话前面八个半的饼都是谷歌做出来的,大家不是一样嘲笑它怎么落后了吗

谷歌并不落后,只是不是第一而已