一分钟读懂deepseek

静静的顿河02
楼主 (文学城)

1. 使用一种奖惩机制训练模型。所以更有效。

2. 目前逻辑,code能力强,语言能力稍差

3. Performance 强,$2 per M token, 国外大模型$60 per M token.

4. Free. 开源。

青裁
你已经总结研究了?我还没来得及读他们的chnicalpaper,只是试了一下效果,非常棒,觉得付$20 GPT冤枉
o
oryzivore
昨天DEI主题大研讨,你却缺了席
我是谁的谁
【使用一种奖惩机制训练模型】,所有的模型训练都用的吧?要不然会overfit
大观园的贾探春
ChatGPT也有免费版的。你如果在乎那$20,也可以用免费版的ChatGPT。
静静的顿河02
这些模型都在不断优化中。将来就像你去看两个医生,诊断结果相似,一个收一毛钱,一个收100刀,你用哪个?
静静的顿河02
这个就比较technical 了。网上有详细解释的。
大观园的贾探春
事关健康,即使$100那位只比免费的就好那么一点点,也要用$100的。企业选择AI也是一样。
静静的顿河02
忙着挣钱养家。哈哈。
大宋
有个预感

deep seek又快又准又小, 根据中国人的思维习惯,deep seek 的强化学习和奖励机制,有可能是基于规则,直奔主题的奖惩,而不是七大的大水满贯。

 

 

 

 

A
Amita
这个可能由不得你,保险公司决定。现在很多保险就不cover brand name,只报销generic药,虽然前者更好
我是谁的谁
这才是正确的方向
我是谁的谁
我的意思是,大家都用奖惩函数(Lasso/Ridge),你列举的第一条并不是DeepSeek独特的机制啊?
我是谁的谁
找到/发明独特的奖惩函数才是牛人
静静的顿河02
应该是找对了训练模型的更有效方法。当年Google 打败Yahoo肯定不是因为更有钱。
专业潜水妈
不是都开源了吗?算法是啥你们牛人们不是看看就懂?
大宋
梁文颂的公司叫做量化同方。而且,deep seek一旦开始

一般正经胡说八道的时候,就会无厘头蹦出大量的量子物理的东西来吓唬人,所以估计,他们的算法与量子物理有关。

 

遇事不决,问量子。这应该是共识吧。瞎猜。

静静的顿河02
我要能一看就懂,还有空在这聊天吗?哈哈。