美AI公司高管:DeepSeek有5万块英伟达H100,但不能说 - 2025年1月28日 / 头条新闻

6 个月前

近日，美国人工智能数据基础公司Scale AI创始人兼首席执行官Alexandr Wang在接受CNBC采访时称，DeepSeek拥有大约五万块英伟达H100芯片，但因美国出口管制措施，他们不能公开谈论。

王在采访中先夸赞了DeepSeek的性能称，“我们发现，DeepSeek（R1）是目前表现最好的，或者说与美国最好的模型（GPT o1）处于同一水平。”

当被问及中美两国在人工智能领域的竞争时，王表示：“长期以来，美国一直处于领先地位。”不过，他补充说，DeepSeek最新的模型确实试图改变这一局面。王认为，“中国实验室在圣诞节发布一款惊天动地的模型具有象征意义，要知道，我们其他人正在庆祝节日。”

Alexandr Wang(王）CNBC

DeepSeek于2024年12月26日（美国时间12月25日）当天发布了一款“震撼性的模型”——DeepSeek-V3，随后又于1月20日推出了一款专注于推理的强大AI模型DeepSeek-R1，对标OpenAI的o1模型。

DeepSeek利用较少且不够先进的芯片训练出了媲美ChatGPT的模型。DeepSeek在一份技术报告中称，它使用超过2000个英伟达H800芯片集群来训练其参数为6710亿的V3模型，而Meta训练参数量4050亿的Llama 3，用了16384块更强的H100显卡，花了54天。Deepseek的训练效率为Meta的11倍。

DeepSeek表示，训练其最新模型之一的成本为560万美元（约合人民币4100万元）。相比之下，人工智能开发商Anthropic的首席执行官达里奥·阿莫迪 (Dario Amodei )去年提到的建立一个模型的成本为1亿至10亿美元。

CNBC曾发文称：“DeepSeek-R1因其性能超越美国顶尖同类模型，且成本更低，算力消耗更少，引发了硅谷的恐慌。”

但王话锋一转，谈到了中国人工智能企业可能为人工智能模型配备的GPU数量。他称，“中国的实验室拥有的H100芯片比人们想象的要多得多。”他补充道， “据我了解，DeepSeek拥有大约五万块H100芯片。”王认为，因为违反了美国实施的出口管制，所以DeepSeek不能谈论这些。

英伟达的Hopper架构GPU如H100和H200，因其优秀的算力，出口受到美国政府的管制。拜登政府于2022年通过一项规定禁止英伟达向中国出售性能远超其旧款GPU A100 的GPU系列，迫使英伟达开发了名为H800和A800的性能削减版芯片用以替代，但一年后的2023年10月，这两款芯片也一并被禁止。目前，英伟达已在推广其最新一代Blackwell架构的GPU，其出口依然受到限制。

王将中美之间的人工智能竞赛描述为一场“AI战争”，并补充道，“美国将需要大量的计算能力和基础设施，我们需要释放美国的能量以推动这场AI繁荣。”

jeffinvade

6 个月

1 楼

新加坡现在是英伟达第二大收入来源国,占2024 Q3 nvidia revenue 的22%，一年翻了5倍，仅次于美国。新加坡一夜成为AI老二了？当然不是。英伟达在新加坡的销量,其中很多gpu最终目的地是中国 5万个H100,价格15亿美金,相当于英伟达卖给新加坡一个季度销量77亿美金的1/5,我觉得把1/5运去中国还是很有可能的

jeffinvade

6 个月

2 楼

我也买了 106.9

jeffinvade

6 个月

3 楼

Sorry $116.90 补仓了100股还买了CEG和 TSM

莎

莎士比亚的天分

6 个月

4 楼

香蕉人，最恨的是谁……

Crosscurrent

6 个月

5 楼

狗急了！哈哈哈！

巫

巫师

6 个月

6 楼

就是你前两月在这里摆数据说美国的医疗有多好吧？美国人民Luigi把医疗保险公司的CEO干掉了，美国人民纷纷拍手称快。你怎么说？ [1评]

刘

刘霍珲

6 个月

7 楼

这哥们输不起啊

jeffinvade

6 个月

8 楼

"众所周知美国医保福利所有发达国家里做的最差,美国政府医疗卫生开支比例是中国的4倍" 我的意思是美国医保最差,但政府投入比例依然是中国4倍来说明中国更差当然,你可以说美国花了29%的预算,不如中国7.3%有效但如果中国也能花29%的中央政府预算在公共卫生上,我觉得实现全民免费医疗也不是问题 [1评]

樱

樱桃儿熟了

6 个月

9 楼

看见这只烂B汉奸的脸，我就觉得恶心。

龙

龙起卷

6 个月

10 楼

又威胁到强国国家安全……制裁……😂😂😂

jeffinvade

6 个月

11 楼

就算他们的research paper给了很多技术细节,但完全复制也不现实复制一次需要6百万美金,这还只是2048个H800用了两个月在算力上花的钱,没人会白花600万美金去重新训练一个新model,因为很多reinforcement的设计依旧会不同

gozzila

6 个月

12 楼

美国高科技大佬包括英伟达都不去说中国有5万块，反而让你所谓的CEO来说，据说有5万块真当人是傻子吗？英伟达跌了 17%的市值，连股票市场也跌了3%，难道他们智障到这个地不会说出来同样的话来减少跌幅？美国人的认知是对的，现在AI的竞争就是美国华人和中国人之间的对决貌似现在美国在下风口，即便是不出DEEPSEEK，老美的STARGATE会把中国拖入星球大战一样的竞争中吗?估计美国提前就可以噶了大数据库需要大量的电量 2023年我国的发电量是9456.4TWh，而老美的发电量只有4494.0 TWh，我们是老美的2.1倍！得州一个大雪可以动死人，电价可以升200%，这种基建你和我说制造业回归，你和我说做消耗巨大的数据库可别逗逼了

weed

6 个月

13 楼

小丑alex 王， [1评]

巫

巫师

6 个月

14 楼

美国人民竟然没有象你一样对美国的医疗感恩戴德，还想着一枪一个CEO,显然美国人民的觉悟远不如你啊~~~ [2评]

jeffinvade

6 个月

15 楼

新加坡现在是英伟达第二大收入来源国,2024 Q3新加坡销售77亿美金,占英伟达收入的22%，一年翻了5倍，仅次于美国。新加坡一夜成为AI老二了？当然不是。英伟达在新加坡的销量,其中很多gpu最终目的地是中国 5万个H100,价格15亿美金,相当于英伟达卖给新加坡一个季度销量77亿美金的1/5,我觉得把1/5运去中国还是很有可能的

jeffinvade

6 个月

16 楼

美国有470万注册护士，中国是563万,但中国人口是美国4倍美国每10万人31个ICU病床,中国只有4个美国癌症五年存活率在70%,中国只是41%,农村更是只有22% 美国流感疫苗接种率60%，中国不到2% 我不是夸美国医疗体系，美国医疗昂贵效率低access差是臭名昭著的，我只是说中国医疗系统capacity其实是不如美国的，所以一个三甲医院的医生，一天要看50个病人。

jeffinvade

6 个月

17 楼

医疗体系，有三个铁三角，access vs quality vs cost，三者不可兼得，只能三选二，只能牺牲一项来提高另外两项。中国是access+cost,牺牲quality。美国是牺牲cost

谁

谁主沉浮？

6 个月

18 楼

明天还要跌

清

清明风水

6 个月

19 楼

5年？你想得太多了！最多5个月

妻

妻妾成群1225

6 个月

20 楼

中国人太坏了、把美国的最后一个裤衩子也给扒下来了……还再次伟大个屁！

eickegao

6 个月

21 楼

deepseek不可能有5万块h100。5万块h100大概要15-20亿美金。deepseek有这么多钱吗？而且人家已经开源了，怎么弄的基本都透明了。 [1评]

eickegao

6 个月

22 楼

meta号称有60万h100，如果5万就可以追上openai。那meta不是早就超过openai了？deepseek就是通过软件和数据优化的方式，使得不需要这么多硬件来堆叠效果。其实给deepseek更多的gpu，也许deepseek的效果会大幅赶超openai。 [1评]

大

大春哥

6 个月

23 楼

這仔是從班加鑼來的？

钻

钻一

6 个月

24 楼

不一定， 2048张H800 训练出来的话说明许多小公司也能够做AI了这岂不是增加了潜在用户数量女大还不是得涨啊 [2评]

钻

钻一

6 个月

25 楼

人家是开源的可以复制和验证需不需要五万张一试便知目前没有跳出来证伪的，说明了什么？

路

路人丫丫

6 个月

26 楼

呵呵。。。你真信的话就应该用真金白银来赌。你这底层不会不知道美股可以买跌的吧？🤣

起

起立致敬

6 个月

27 楼

美国要是彻底把AI芯片禁了，这企业也就嗝屁了。

jeffinvade

6 个月

28 楼

Highflyer管理着80亿美金资产花15亿问题不大而且很可能只是用芯片，租的数据中心的时间/算力，并不拥有芯片

Big_Mac

6 个月

29 楼

chinese chinese vs american chinese, hahaha!

jeffinvade

6 个月

30 楼

AI更便宜,对很多公司是利好比如苹果,比如salesforce, 比如service now,比如ACN 这些公司的data会有更多AI的应用,ROI会更高,会带来更大revenue 所以这些公司股票今天都在涨但对芯片和核电/天然气公司来说可不是好事就算Ai应用因此增加三倍，但训练所需算力只是之前的1/15-1/10，对英伟达的芯片需求和电力需求依旧会减少1/5-1/3

jeffinvade

6 个月

31 楼

减少到目前预计的1/5-1/3

newgreatwall

6 个月

32 楼

美国人五天工作，每天实干只有5小时，其他时间都是喝咖啡、抽烟或者聊天。而中国人的勤奋他们能够比上吗？

无

无聊师

6 个月

33 楼

看看后续会有什么故事。

albertjia!

6 个月

34 楼

狗粮说数据，狗粮主子粑粑都发笑，为啥呢，狗粮作为单细胞雌雄同体低等下贱畜生，最多就是吃屎闹肚子食物中毒，从来就没有去过医院啊，全凭想象来猜测呢。数据狗粮说说是不是今天没有吃到主子粑粑的隔夜大便很郁闷啊？

城

城市沉睡

6 个月

35 楼

大家又一次见证了造谣是多么普遍。

flying72

6 个月

36 楼

大的服务型公司，这轮下跌，顶多是前期投资打水漂，但可以从后期成本降低获益。初创AI公司真的是哀鸿遍野，尤其是研究算法的。 [1评]

今

今日雨果

6 个月

37 楼

. 📍回复1楼:. “ 这个deepseek真的很厉害 AI里唯一懂政治的你问他64它就跟你讲法律了” . 原形毕露，祸国殃民，呵呵😄哈哈😂 。 . 📍回复14楼:. 侬讲得蛮精辟👍 。回答；其实不用担心，只不过是聊天软件升级了而已。。 . 📍[16楼]评论人:hotcpu [☆品衔R3☆] [个人频道] [个人动态] 发送时间: 2025年01月25日 9:47:26 【回复】把技术的事留给技术吧，别往上套政治了。 deepseek 的技术优势是他的训练方法。而这方法是基于蒸馏其他大模型而来的。换句话说，在其他大模型完成训练的基础上才有效。这可以大幅降低进一步训练的成本。但隐患是他的模型并不是从材料里直接训练出来的，开源也许没问题，一旦蒸馏被禁止，他的成本就会直线上升。 . . 📍[57楼]评论人:今日雨果 [☆品衔R4☆] [个人频道] [个人动态] 发送时间: 2025年01月27日 4:52:44 【回复】回复37楼:“ 人类第几次尝试建巴别塔了，在ai这座塔上，基于其特殊的机制 -- 全是互相抄袭，永远在最高的那座塔上，继续往上建。资本很拧巴，冲了不一定挣钱，不冲一定挣不到钱，结果就是还会拧巴的往里冲，虽然全世界心不齐，都互相想干掉对方，但是这座塔却还能在互相抄袭，改进，封锁，扭曲中越建越高，是福是祸？事情变得有意思起来了。” . 侬迭个观点、思考精神，很有意思，🤔 . 鹅呃观点：Je vois ce phénomène d'IA à la mode différemment｜I see this trendy AI phenomenon differently | 我对这种时髦的AI 看法不同见鹅下面另1个评论帖 . . 📍回复43楼:. 事实上，谷歌搜索引擎，比小雨开发的“知识搜索引擎”晚了20+年❗️ . 🌴🌳🌲 https://HugoAujourdhui.org/ ☞ 🕯️ ☞ 🤔😊 🌿Ce bébé du moteur de recherche est né N ans plus tôt (N = 20+) que le moteur de recherche Google Re: les meilleurs produits, ils ont presque toujours été conçus pour le bénéfice des personnes qui les construisent réellement ☞ 🍃 🍃 🍃 2024-12-18 🌿This Search engine baby was born N years earlier (N = 20+) than Google search engine was born Re: greatest products, they've almost always been designed for the benefit of the people who are actually building them ☞ 🍃 🍃 🍃 . . 回答：来来来，老子给你们这些傻逼科普一下美国搞了环球资源，中国抄袭搞了阿里巴巴美国搞了搜索引擎谷歌，中国搞个百度美国搞个谷歌地图，中国搞了百度地图美国兴起电动车，中国也跟着美国搞了优步打车，中国抄袭搞嘀嘀打车美国搞ChatGPT 中国抄袭搞个deepseek 看明白了狗逼们？抄袭的是人家的概念！技术不怕你抄袭，但创新概念你是抄袭不去的！要老子说，中国最牛逼的创意其实是团购！其他的就别丢人现眼了。。

我

我已潜水很多年

6 个月

38 楼

这哥们儿不知道昨天亏了多少，恨得牙痒痒吧，哈哈反正中国人都很开心呢

今

今日雨果

6 个月

39 楼

. 鹅觉得，AI目前赶时髦的做法，重点放得勿对，必须从基础性的东西做起。 🤔. 《Je vois ce phénomène d'IA à la mode différemment｜I see this trendy AI phenomenon differently ｜我对这种赶时髦的 AI 现象有不同的看法》 . Humanism-Q (HQ), my this invention in 2009 can lead AI walk out of the jungle, get rid of the "Law of the jungle". https://hugoaujourdhui.org/livre-blanc/philosophie/humanismeq-eq-iq-aq . Victor Universel Labo - VUL - 飞鸥实验室 V1.000.2025-01-26, 1989-06-04 Nice, Côte d'Azur、Paris, France . 回答： [60楼]评论人:flying72 [♂★★★飞翔的自行车★★★♂] [个人频道] [个人动态] 发送时间: 2025年01月27日 21:31:02 【回复】回复11楼:大的服务型公司，这轮下跌，顶多是前期投资打水漂，但可以从后期成本降低获益。初创AI公司真的是哀鸿遍野，尤其是研究算法的。

bk59

6 个月

40 楼

2048的是V3当时没什么动静。这两天火了的R1不知道

jujubi

6 个月

41 楼

如果2048个GPU就可以训练出AI，连我都在认真考虑是否也搭建一个系统了。因此个人和小公司购买英伟达芯片数量会超过几个大公司。

jujubi

6 个月

42 楼

程序开源但是数据不开源，这些数据从哪里来，怎样训练的信息不详。有人说是用了其他人工智能的数据。