成本仅50美元，性能媲美Deepseek-R1，李飞飞带着S1来炸场了

4 个月

简单总结是蒸ChatGPT 需要5百万美元蒸阿里的只需50 美元

jason1020

4 个月

AI 版本的水变油。

4 个月

是有这个感觉

4 个月

不是蒸馏阿里的，而是蒸馏谷歌的。Gemini 2.0是谷歌的，不是阿里的。

4 个月

这个蒸馏能够work的前题是已经有了谷歌的Gemini 2.0的大模型。

4 个月

说的是这个 s1模型的训练并非从零开始，而是基于阿里云通义千问（Qwen）模型进行监督微调。二级蒸馏

4 个月

DS 的前提是？

4 个月

报道里我没看到提到阿里的Qwen，只提到谷歌的Gemini 2.0。

4 个月

那你现在看到了再评论一下？

4 个月

据说是OpenAI的GPT。

BeKindPerson

4 个月

没ChatGPT 哪来的DS？DS应感恩前辈…

4 个月

在你主帖链接的那篇报道里还是没看到。

Sweetiemm

4 个月

天下文章一大抄的AI版

bia

4 个月

告诉你们一个AI的秘密

4 个月

评论讲各路牛鬼蛇神闪亮登场

4 个月

哈哈

4 个月

AI ethics 应当是最大的挑战了

4 个月

openAI可是非法使用了无数版权作品培训，不仅官司缠身，还有吹哨人莫名其妙死亡。这是问题最大的一个。

4 个月

蒸馏不涉及版权问题，用版权文章作培训则涉嫌侵权

4 个月

谷歌Gemini的信息是向有执照的信息供应者购买的，没有版权争议。

幸

幸福象花儿一样

4 个月

以后这个行业就得细分，象石油行业一样，挖油-初炼-精炼，没有必要造肥皂的得从挖油干起。数据也一样

Open AI， Google 等做的就是数据收集及初炼，需要庞大的硬件投资，但不需要适用各领域的输出端精确性；

DS 等等提供数据精炼，轻硬件重模型，提供更适合各个领域的输出端精确性。

当然，DS需要给GOOGLE等初炼企业付费。Google等想做垂直供应链，也不是不行，就看愿不愿意投入资源去customize各领域的精炼版模型,能不能比DS，李飞飞等做的更好更便宜。

4 个月

不了解，应该比openai 干净

jit

4 个月

你的意思是说侵权是别人的事，使用侵权的结果来蒸一次就洗白白了？

4 个月

洗白个球，但要把事实讲清楚

4 个月

看来DeepSeek也不需要象Alex Wang说的用了几万块H100也能训练成功

挖

挖矿

4 个月

有道理

julie116

4 个月

避免大忽悠们把政府和大家的钱都卷走然后人间蒸发或实行独裁统治

4 个月

问题是AI训练结果没有版权，没法收费。而且Openai用版权材料训练也没付费，真要付版费不会少

幸

幸福象花儿一样

4 个月

这不是刚兴起嘛，以后肯定会规范的。

4 个月

我支持建立规则保护各方利益

mom2023

4 个月

小声说50刀。现在掏粪工一小时都不够这个价格LO L

Knight_2024

4 个月

是蒸馏阿里Qwen, 这是李飞飞的论文。

SabrinaD

4 个月

五十刀是cloud computing 的租用费，说明蒸馏不需要多少算力。女大又要跌。那几个炒股的又要出来混淆视听了。