说说Deepseek,取巧加吹牛,会捞一把,但走不远的

y
youtub
楼主 (文学城)

 

简单说说Deepseek

Deepseek 采用混合专家(Mixture-of-Experts,MoE)架构, 创新之处包括细粒度专家细分和共享专家隔离,提升了 MoE 架构的效率和性能。(这是国内的说法)

但是训练它需要高质量的数据。它提出之初就有人怀疑利用chatgpt的输出作为训练数据。所以有人对Deepseek提问你是哪个模型,deepseek回答我是chatgpt. 

openAI是真正的从零开始,利用原始数据和追求通用智能。Deepseek所谓训练量只有chatGPT的1/30是夸大了,因为没有计入获取高质量数据的成本。现在也有质疑deepseek故意缩小了它拥有的GPU卡数量和训练计算量。

另外它的通用智能上限也不如从原始数据中生成的大模型高。

再就是开源,拿训练好的用,当然可以。但要验证它的训练量,要花大量金钱,它现在不怕训练计算量的验证,就是因为有这个高花费的门槛。

Deepseek实际是取巧加吹牛,走不远的。上面内容昨天在紫檀发过,被删。今天什么遭大规模攻击宕机的说法就来了,只开放大陆注册了。 开发它的幻方公司用的是国内2流人才,做的量化交易也亏空不少。现在有消息说幻方已经做空NVDA,要捞一把了.    
C
CatcherInTheRye
实事求是,人家公司自己从没吹过什么牛。至于是不是取巧,那是技术问题我不懂
未知
Deepseek本身是Flash-in-the-pen。但它的贡献是,证明了可以廉价运行相当不错的AI

Deepseek 没有知识堡垒,护城河。肯定会涌现出许多竞争对手。这会进一步加深人工智能被广泛应用。

 

y
youtub
雇枪手吹就不是自己吹了。我认识国内做AI大公司的人,都看不起它的。没有国内其它AI大公司懂行的赞它的,是媒体在讲故事。
b
busy_mom
雇的美国媒体吗?
W
Wei_PDX
他们上了新闻联播+总理座谈会发言。所以肯定不是吹牛,是有真正的成绩的

是国家信用的某种背书。

y
youtub
如果投注会被Deepseek影响的股票,我建议用一个方法了解一下它的底细