一分钟读懂deepseek - 2025年1月25日文学峸存档

静

静静的顿河02

6 个月

楼主 (文学峸)

1. 使用一种奖惩机制训练模型。所以更有效。

2. 目前逻辑，code能力强，语言能力稍差

3. Performance 强，$2 per M token, 国外大模型$60 per M token.

4. Free. 开源。

青

青裁

6 个月

你已经总结研究了？我还没来得及读他们的chnicalpaper,只是试了一下效果，非常棒，觉得付$20 GPT冤枉

oryzivore

6 个月

昨天DEI主题大研讨，你却缺了席

我

我是谁的谁

6 个月

【使用一种奖惩机制训练模型】，所有的模型训练都用的吧？要不然会overfit

大

大观园的贾探春

6 个月

ChatGPT也有免费版的。你如果在乎那$20，也可以用免费版的ChatGPT。

静

静静的顿河02

6 个月

这些模型都在不断优化中。将来就像你去看两个医生，诊断结果相似，一个收一毛钱，一个收100刀，你用哪个？

静

静静的顿河02

6 个月

这个就比较technical 了。网上有详细解释的。

大

大观园的贾探春

6 个月

事关健康，即使$100那位只比免费的就好那么一点点，也要用$100的。企业选择AI也是一样。

静

静静的顿河02

6 个月

忙着挣钱养家。哈哈。

大

大宋

6 个月

有个预感

deep seek又快又准又小, 根据中国人的思维习惯,deep seek 的强化学习和奖励机制，有可能是基于规则，直奔主题的奖惩，而不是七大的大水满贯。

Amita

6 个月

这个可能由不得你，保险公司决定。现在很多保险就不cover brand name，只报销generic药，虽然前者更好

我

我是谁的谁

6 个月

这才是正确的方向

我

我是谁的谁

6 个月

我的意思是，大家都用奖惩函数（Lasso/Ridge），你列举的第一条并不是DeepSeek独特的机制啊？

我

我是谁的谁

6 个月

找到/发明独特的奖惩函数才是牛人

静

静静的顿河02

6 个月

应该是找对了训练模型的更有效方法。当年Google 打败Yahoo肯定不是因为更有钱。

专

专业潜水妈

6 个月

不是都开源了吗？算法是啥你们牛人们不是看看就懂？

大

大宋

6 个月

梁文颂的公司叫做量化同方。而且，deep seek一旦开始

一般正经胡说八道的时候，就会无厘头蹦出大量的量子物理的东西来吓唬人，所以估计，他们的算法与量子物理有关。

遇事不决，问量子。这应该是共识吧。瞎猜。

静

静静的顿河02

6 个月

我要能一看就懂，还有空在这聊天吗？哈哈。