从小扎对DeepSeek的分析,长持NVDA没有风险

未知
楼主 (文学城)

小扎说,像DS这样的Thinking模型,实际可能会加大对算力的需求,特别是对像META这样的公司。

Deepseek R1 reasoning/thinking 模型,轻训练, 重推理。将计算量,转移到推理(Inference)阶段。实测DS,也发现它要《Thinking...》好长时间。回答每个问题,要花很长时间,要花更多的计算。

对于像META这样有用户众多的公司,可能并不在效益划算。因为训练就一次,而推理每天就有上亿次。也就是说,Thinking模型 Scaling 不好。

小扎的看的确有道理。就像为什么搞大的发电厂,而不是每家都有个小发电机的道理一样。

这也就是说:NVDA 是里外里都是躺赢:

(1) OpenAI式模型:重训练(需要大量GPUs), 轻推理 (需要较少量GPU);

(2)DeepSeek式Thinking 模型: 轻训练(需要较少量GPU),重推理(需要大量GPU去支持大量用户提问题)

分析下来,*长持NVDA* 没有多少风险, 躺赢了。让花街不懂的人,去瞎折腾吧!哈哈!

 

 

 

鬼眼狂刀
最終掐死英伟达的不是DeepSeek,是美國政府
M
Maui2021
agree.
H
Hightides
今天去酒吧要少喝点,昨天买的BA和NVDA全水下了,鸡腿过年已经吃了,今天要节酒,呵呵
越挫越勇2
老虎,我也在水下呢。你喝啥酒?
七月徐风
我一直觉得模型复杂的话计算量只会更大,没听说过模型越复杂,计算量越小的

除非the. Size of the data is way way smaller

H
Hightides
我买的少,就个酒钱,酒吧一般啤酒多,在家whiskey,不用开车,呵呵
越挫越勇2
最近发现了一个红酒 LifeVine, 0-added sugar, low carb. :-D
H
Hightides
谢谢下次我试试,红酒我一不小心就能喝一瓶,后来发现糖太多了,转向了烈酒。
加州lalin
国内博主今天就在那说,Open Ai即使查出DS违规,最多封ID,拿不出啥实质性处罚。
M
Maui2021
皮挺厚的
越挫越勇2
我也是,一瓶转眼就喝光了:-) Have a good night!
波粒子3
META 现在有类似deepseek的应用吗?
心向往
猜测老川已在怀疑老黄了
未知
Deepseek 不是应用,本身就是基于Llama3的大模型,估计功能与Llama4差不多

DeepSeek 是reasoning模型,也就是说,在推理的时候,需要多步Thinking,才能产生好的答案。

相当于有两个学生,一个顺口就能给出答案,另一个要想一会才能给出答案。两个学生,谁更好呢?要看具体情况。

f
from中国
重训练轻推理,相当于中国教育模式,死记硬背的多。做各种练习题。
f
from中国
重推理,时更智能的模式,举一反三, 自己思考