楼下的文章写的很好：DS填平了Nvidia的护城河，CUBA. - 2025年1月30日文学城存档 - 看帖神器

← 下载《看帖神器》官方 iOS App，体验轻松追帖。

高山峻岭流水人家

大约 10 小时

楼主 (文学城)

不用CUBA也能进行Al大模型训练。

以前，没有Nvidia的芯片，Al就无法前进。

现在可以用其他芯片来发展Al了。

据说现在DS完全用华为的升腾进行操作。

下一个大模型训练将全部用华为的升腾芯片。

现在就是100%对他国进行芯片封锁，

已经无法阻止其他人Al发展的步伐了。

Nvidia 的股价下跌是在情理之中的。

YMYD.

亚特兰蒂斯

大约 10 小时

高看华为了，华为的芯片问题多多。

大约 10 小时

DS填平了Nvidia的护城河？没有的事，哈哈，无非是为了在被阉割的芯片上增加效率而已

理论上什么芯片都可以，只是效率的区别

高山峻岭流水人家

大约 10 小时

最新消息

高山峻岭流水人家

大约 10 小时

自己好好做点功课。我这Al盲还是下了点功夫，最近避免了巨额资金损失。

差点跟风投Nvidia, VGT.

亚特兰蒂斯

大约 10 小时

对，但DS可能绕过了cuda, 副产品比主营还出效果。

大约 10 小时

我也这样怀疑，动静这么大肯定有进一步芯片制裁，预案必须有

大约 10 小时

看来你是懂些芯片,assembly 成不了大气候，不然就没有Java了，华为的问题是老川制裁后以前靠欧洲

那部分的支持都撤了．独掌难行

大约 10 小时

不就是华尔街做空吗？什么都是理由。当年做空特斯拉，现在看看，哈哈

大约 10 小时

高医生不懂高科技，不要瞎讲 :-)

DS是蒸馏来的，是压缩，不是原创。智慧来自原创，效率来自压缩。就像长篇小说，改编成小故事，读起来更快一样。

大约 10 小时

那我们都改汇编好了，用什么java,.net?DeepSeek 是在干没办法的办法，正说明了他们是用nvda训练的，不然

发神经了，用汇编去提高效率，将来更不好移植？不过人力便宜，哈哈

高山峻岭流水人家

大约 10 小时

就是因为不懂，才要加强学习：尽量在这日新月异的时代不亏钱。

大约 10 小时

认为CUDA就这样被DS取代了？哈哈哈。

大约 10 小时

MSN.com有文章”Deep Ai confirmed to be powered by a Huawei chip

大约 10 小时

就好像学英语，别人在博览群书，DeepSeek 把以往的考题背了一遍，照样考高分，哈哈

你看书得好几年，他只要几个月就好

大约 10 小时

没有官方背书

大约 10 小时

传说中的小镇做题家，呵呵

大约 10 小时

没有替代方案，傻子才会高调招来进一步制裁，不过可能他们没有投坛聪明

米奇的厨房

大约 10 小时

多快好省是永远的目标

大约 9 小时

看一篇比较专业的评价

https://stratechery.com/2025/deepseek-faq/

不懂计术的就不要传小道消息了，我们搞这一行的人每天读deepseek paper.

their most recent DS R1 paper is at https://arxiv.org/pdf/2501.12948

DeepSeek ... implemented cross-GPU communications ... using PTX. They did not use CUDA ... THAT is crazy significant.

H100s were prohibited by the chip ban, but not H800s. Everyone assumed that training leading edge models required more interchip memory bandwidth, but that is exactly what DeepSeek optimized both their model structure and infrastructure around.

Again, just to emphasize this point, all of the decisions DeepSeek made in the design of this model only make sense if you are constrained to the H800; if DeepSeek had access to H100s, they probably would have used a larger training cluster with much fewer optimizations specifically focused on overcoming the lack of bandwidth.

随便看一眼

大约 9 小时

隔行如隔山

随便看一眼

大约 9 小时

隔行如隔山

随便看一眼

大约 9 小时

隔行如隔山

大约 9 小时

哈哈，的确！如果谁说应该用汇编，因为效率高，那就算他赢了

大约 9 小时

多快好省就是卷的祖宗啊，哈哈

大约 9 小时

这就是我的意思，这正是证明了他们用的阉割的NVDA芯片，深度绑定，还脱轨，骗谁？哈哈

大约 9 小时

他们也用在google TPU，很快就可以用在华为芯片上

大约 9 小时

你干嘛要告诉他们啊。让他们“大国自信”，多好啊。

大约 9 小时

谈技术就谈技术，老是扯什么政治。 DeepSeek 有恒几项技术，有革命性的意义

大约 9 小时

还不是NVDA的芯片快，适合AI，换成什么芯片不行？就是坐飞机和拖拉机的区别嘛

大约 9 小时

good for you. 我绝不帮粉红挣美股的钱。

大约 9 小时

In the long run, model commoditization and cheaper inference

which DeepSeek has also demonstrated — is great for Big Tech

DeepSeek brings good competition to US AI industry, which will lead to lower cost and better AI tool for everyone.

大约 9 小时

这是不是也可以补上华为GPU的短板？

大约 9 小时

醒醒吧，当时华为Mate出来时和IPhone速度差不多

大约 9 小时

卷王之王。

大约 9 小时

赞。开源对闭源的胜利

大约 9 小时

他们可以帮华为设计芯片，doing inference or model training

大约 9 小时

google has been doing this, Amazon too

大约 8 小时

make sense. 估计早开始弄了。

大约 8 小时

但现阶段都跟nvidia 有很大差距

大约 8 小时

而且设计出来，但没有台积电生产不出来

大约 8 小时

光刻机是关键。华为是世界上最卷的企业，放卫星的可能性不小。

大约 7 小时

哈哈，不是遥遥领先吗？

大约 7 小时

ta 是带任务的。

大约 6 小时

不想谈，忍不住，粉红太讨厌。