说说Deepseek，取巧加吹牛，会捞一把，但走不远的 - 2025年1月27日文学峸存档

5 个月

楼主 (文学峸)

简单说说Deepseek

Deepseek 采用混合专家（Mixture-of-Experts，MoE）架构，创新之处包括细粒度专家细分和共享专家隔离，提升了 MoE 架构的效率和性能。（这是国内的说法）

但是训练它需要高质量的数据。它提出之初就有人怀疑利用chatgpt的输出作为训练数据。所以有人对Deepseek提问你是哪个模型，deepseek回答我是chatgpt.

openAI是真正的从零开始，利用原始数据和追求通用智能。Deepseek所谓训练量只有chatGPT的1/30是夸大了，因为没有计入获取高质量数据的成本。现在也有质疑deepseek故意缩小了它拥有的GPU卡数量和训练计算量。

另外它的通用智能上限也不如从原始数据中生成的大模型高。

再就是开源，拿训练好的用，当然可以。但要验证它的训练量，要花大量金钱，它现在不怕训练计算量的验证，就是因为有这个高花费的门槛。

Deepseek实际是取巧加吹牛，走不远的。上面内容昨天在紫檀发过，被删。今天什么遭大规模攻击宕机的说法就来了，只开放大陆注册了。开发它的幻方公司用的是国内2流人才，做的量化交易也亏空不少。现在有消息说幻方已经做空NVDA，要捞一把了.

5 个月

实事求是，人家公司自己从没吹过什么牛。至于是不是取巧，那是技术问题我不懂

5 个月

Deepseek本身是Flash-in-the-pen。但它的贡献是，证明了可以廉价运行相当不错的AI

Deepseek 没有知识堡垒，护城河。肯定会涌现出许多竞争对手。这会进一步加深人工智能被广泛应用。

5 个月

雇枪手吹就不是自己吹了。我认识国内做AI大公司的人，都看不起它的。没有国内其它AI大公司懂行的赞它的,是媒体在讲故事。

5 个月

雇的美国媒体吗？

5 个月

他们上了新闻联播+总理座谈会发言。所以肯定不是吹牛，是有真正的成绩的

是国家信用的某种背书。

5 个月

不知那点在吹-- README.md

5 个月

如果投注会被Deepseek影响的股票，我建议用一个方法了解一下它的底细