这个话题我比较感兴趣,多说两句。Deep seek的创新,对于AI领域而言是划时代的。是paradigm shift。为什么呢? 在此之前,AI是以算力为王。过去十年,AI对算力的需求是指数型增长,好像是一年13倍的样子。这是不可持续的。Nvidia所以占据龙头地位,不仅仅是他的GPU厉害,他的CUDA厉害,最重要的是他能有效集成成千上万个GPU。单个芯片,A MD,苹果,Intel都有一拼之力,但是比起大型数据中心,无人能及。deep seek一出来,大家看到了另一条路,不用拼算力了,可以在算法上下功夫。所以一下子所有的AI公司都懵了,要重新评估怎么走以后的路,资金投入方向,研究方向都要调整。deep seek的影响并不是推出一个新模型,而是指出一个新方向,而且证明这个方向的可行性。他现在的模型只是一个开头,并不是最优。
业内人士都在研究技术,华尔街在研究市场和资本的流动方向。所以股市受到冲击。消息刚出来,Nvidia,台积电一日之内大跌17%,连最近火爆的核能都开始降温。现在大多数人的感觉是,算力需求降低后,其实会迎来AI应用的大爆发。因为更多的人和公司可以meaningfully 加入AI这个战场。以前我们都开玩笑,没有几个$B买硬件,根本不要想插手AI。所以对硬件的总需求长期来看可能不减反增。最近台积电的股票跌了一阵又开始回头了。
一己之见,欢迎讨论。
一个是管理多线程,另一个是GPU之间的通讯。DS直接调用GPU底层函数来自己管理线程和通讯。如果NVDA下一代的底层函数库不向下兼容,DS的管理程序就要完全从新来一遍。。。。。。不是每一个小公司都有这样的实力
这个话题我比较感兴趣,多说两句。Deep seek的创新,对于AI领域而言是划时代的。是paradigm shift。为什么呢? 在此之前,AI是以算力为王。过去十年,AI对算力的需求是指数型增长,好像是一年13倍的样子。这是不可持续的。Nvidia所以占据龙头地位,不仅仅是他的GPU厉害,他的CUDA厉害,最重要的是他能有效集成成千上万个GPU。单个芯片,A MD,苹果,Intel都有一拼之力,但是比起大型数据中心,无人能及。deep seek一出来,大家看到了另一条路,不用拼算力了,可以在算法上下功夫。所以一下子所有的AI公司都懵了,要重新评估怎么走以后的路,资金投入方向,研究方向都要调整。deep seek的影响并不是推出一个新模型,而是指出一个新方向,而且证明这个方向的可行性。他现在的模型只是一个开头,并不是最优。
业内人士都在研究技术,华尔街在研究市场和资本的流动方向。所以股市受到冲击。消息刚出来,Nvidia,台积电一日之内大跌17%,连最近火爆的核能都开始降温。现在大多数人的感觉是,算力需求降低后,其实会迎来AI应用的大爆发。因为更多的人和公司可以meaningfully 加入AI这个战场。以前我们都开玩笑,没有几个$B买硬件,根本不要想插手AI。所以对硬件的总需求长期来看可能不减反增。最近台积电的股票跌了一阵又开始回头了。
一己之见,欢迎讨论。
一个是管理多线程,另一个是GPU之间的通讯。DS直接调用GPU底层函数来自己管理线程和通讯。如果NVDA下一代的底层函数库不向下兼容,DS的管理程序就要完全从新来一遍。。。。。。不是每一个小公司都有这样的实力