浅谈deep seek的影响。

c
cyg
楼主 (文学城)

这个话题我比较感兴趣,多说两句。Deep seek的创新,对于AI领域而言是划时代的。是paradigm shift。为什么呢? 在此之前,AI是以算力为王。过去十年,AI对算力的需求是指数型增长,好像是一年13倍的样子。这是不可持续的。Nvidia所以占据龙头地位,不仅仅是他的GPU厉害,他的CUDA厉害,最重要的是他能有效集成成千上万个GPU。单个芯片,A MD,苹果,Intel都有一拼之力,但是比起大型数据中心,无人能及。deep seek一出来,大家看到了另一条路,不用拼算力了,可以在算法上下功夫。所以一下子所有的AI公司都懵了,要重新评估怎么走以后的路,资金投入方向,研究方向都要调整。deep seek的影响并不是推出一个新模型,而是指出一个新方向,而且证明这个方向的可行性。他现在的模型只是一个开头,并不是最优。

业内人士都在研究技术,华尔街在研究市场和资本的流动方向。所以股市受到冲击。消息刚出来,Nvidia,台积电一日之内大跌17%,连最近火爆的核能都开始降温。现在大多数人的感觉是,算力需求降低后,其实会迎来AI应用的大爆发。因为更多的人和公司可以meaningfully 加入AI这个战场。以前我们都开玩笑,没有几个$B买硬件,根本不要想插手AI。所以对硬件的总需求长期来看可能不减反增。最近台积电的股票跌了一阵又开始回头了。

 

一己之见,欢迎讨论。

简单好
对于做ai产品的公司来说cost和准确可靠非常重要,价格下来和推理能力的提升会促进产品的开发和推广
S
Stockticker
Very good thought. Thank you for sharing
c
cyg
关键是降低了entry,barrier。很多AI玩家可以下场了。
p
parentb
有一些小的创新,如使用所谓蒸馏技术用别人投入几十亿几百亿的大模型数据来训练自己的小模型而已,并不是完全靠自己打造的。
p
parentb
没有ChatGPT,就没有DeepSeek。在DS问世前很多公司已经用ChatGPT来训练自己的小模型了。不要不懂装懂。
云崖水暖
这是一厢情愿,CUDA的作用有两个:

一个是管理多线程,另一个是GPU之间的通讯。DS直接调用GPU底层函数来自己管理线程和通讯。如果NVDA下一代的底层函数库不向下兼容,DS的管理程序就要完全从新来一遍。。。。。。不是每一个小公司都有这样的实力

c
cyg
如果真这么简单,你能解释一下为什么这些先行的公司没有被市场重视吗?
p
parentb
你什么都不懂!我们公司是做网络安全的,我们公司也正在用ChatGPT训练我们公司业务相关的小AI模型!