美AI公司高管:DeepSeek有5万块英伟达H100,但不能说

今日头条
Toutiao
最新回复:2025年1月28日 11点21分 PT
  返回列表
96028 阅读
83 评论
观察者网

近日,美国人工智能数据基础公司Scale AI创始人兼首席执行官Alexandr Wang在接受CNBC采访时称,DeepSeek拥有大约五万块英伟达H100芯片,但因美国出口管制措施,他们不能公开谈论。

王在采访中先夸赞了DeepSeek的性能称,“我们发现,DeepSeek(R1)是目前表现最好的,或者说与美国最好的模型(GPT o1)处于同一水平。”

当被问及中美两国在人工智能领域的竞争时,王表示:“长期以来,美国一直处于领先地位。”不过,他补充说,DeepSeek最新的模型确实试图改变这一局面。王认为,“中国实验室在圣诞节发布一款惊天动地的模型具有象征意义,要知道,我们其他人正在庆祝节日。”

Alexandr Wang(王)CNBC

DeepSeek于2024年12月26日(美国时间12月25日)当天发布了一款“震撼性的模型”——DeepSeek-V3,随后又于1月20日推出了一款专注于推理的强大AI模型DeepSeek-R1,对标OpenAI的o1模型。

DeepSeek利用较少且不够先进的芯片训练出了媲美ChatGPT的模型。DeepSeek在一份技术报告中称,它使用超过2000个英伟达H800芯片集群来训练其参数为6710亿的V3模型,而Meta训练参数量4050亿的Llama 3,用了16384块更强的H100显卡,花了54天。Deepseek的训练效率为Meta的11倍。

DeepSeek表示,训练其最新模型之一的成本为560万美元(约合人民币4100万元)。相比之下,人工智能开发商Anthropic的首席执行官达里奥·阿莫迪 (Dario Amodei )去年提到的建立一个模型的成本为1亿至10亿美元。

CNBC曾发文称:“DeepSeek-R1因其性能超越美国顶尖同类模型,且成本更低,算力消耗更少,引发了硅谷的恐慌。”

但王话锋一转,谈到了中国人工智能企业可能为人工智能模型配备的GPU数量。他称,“中国的实验室拥有的H100芯片比人们想象的要多得多。”他补充道, “据我了解,DeepSeek拥有大约五万块H100芯片。”王认为,因为违反了美国实施的出口管制,所以DeepSeek不能谈论这些。

英伟达的Hopper架构GPU如H100和H200,因其优秀的算力,出口受到美国政府的管制。拜登政府于2022年通过一项规定禁止英伟达向中国出售性能远超其旧款GPU A100 的GPU系列,迫使英伟达开发了名为H800和A800的性能削减版芯片用以替代,但一年后的2023年10月,这两款芯片也一并被禁止。目前,英伟达已在推广其最新一代Blackwell架构的GPU,其出口依然受到限制。

王将中美之间的人工智能竞赛描述为一场“AI战争”,并补充道,“美国将需要大量的计算能力和基础设施,我们需要释放美国的能量以推动这场AI繁荣。”

j
jeffinvade
1 楼
新加坡现在是英伟达第二大收入来源国,占2024 Q3 nvidia revenue 的22%,一年翻了5倍,仅次于美国。 新加坡一夜成为AI老二了?当然不是。英伟达在新加坡的销量,其中很多gpu最终目的地是中国 5万个H100,价格15亿美金,相当于英伟达卖给新加坡一个季度销量77亿美金的1/5,我觉得把1/5运去中国还是很有可能的
j
jeffinvade
2 楼
我也买了 106.9
j
jeffinvade
3 楼
Sorry $116.90 补仓了100股 还买了CEG和 TSM
莎士比亚的天分
4 楼
香蕉人,最恨的是谁……
C
Crosscurrent
5 楼
狗急了!哈哈哈!
巫师
6 楼
就是你前两月在这里摆数据说美国的医疗有多好吧? 美国人民Luigi把医疗保险公司的CEO干掉了,美国人民纷纷拍手称快。你怎么说? [1评]
刘霍珲
7 楼
这哥们输不起啊
j
jeffinvade
8 楼
"众所周知美国医保福利所有发达国家里做的最差,美国政府医疗卫生开支比例是中国的4倍" 我的意思是美国医保最差,但政府投入比例依然是中国4倍 来说明中国更差 当然,你可以说美国花了29%的预算,不如中国7.3%有效 但如果中国也能花29%的中央政府预算在公共卫生上,我觉得实现全民免费医疗也不是问题 [1评]
樱桃儿熟了
9 楼
看见这只烂B汉奸的脸,我就觉得恶心。
龙起卷
10 楼
又威胁到强国国家安全……制裁……😂😂😂
j
jeffinvade
11 楼
就算他们的research paper给了很多技术细节,但完全复制也不现实 复制一次需要6百万美金,这还只是2048个H800用了两个月在算力上花的钱,没人会白花600万美金去重新训练一个新model,因为很多reinforcement的设计依旧会不同
g
gozzila
12 楼
美国高科技大佬包括英伟达都不去说中国有5万块,反而让你所谓的CEO来说,据说有5万块 真当人是傻子吗? 英伟达跌了 17%的市值, 连股票市场也跌了3%,难道他们智障到这个地不会说出来同样的话来减少跌幅? 美国人的认知是对的, 现在AI的竞争就是 美国华人和中国人之间的对决 貌似现在美国在下风口,即便是不出DEEPSEEK, 老美的STARGATE会把中国拖入星球大战一样的竞争中吗?估计美国提前就可以噶了 大数据库需要大量的电量 2023年我国的发电量是9456.4TWh,而老美的发电量只有4494.0 TWh,我们是老美的2.1倍! 得州一个大雪可以动死人,电价可以升200%,这种基建你和我说制造业回归,你和我说做消耗巨大的数据库 可别逗逼了
w
weed
13 楼
小丑alex 王, [1评]
巫师
14 楼
美国人民竟然没有象你一样对美国的医疗感恩戴德,还想着一枪一个CEO,显然美国人民的觉悟远不如你啊~~~ [2评]
j
jeffinvade
15 楼
新加坡现在是英伟达第二大收入来源国,2024 Q3新加坡销售77亿美金,占英伟达收入的22%,一年翻了5倍,仅次于美国。 新加坡一夜成为AI老二了?当然不是。英伟达在新加坡的销量,其中很多gpu最终目的地是中国 5万个H100,价格15亿美金,相当于英伟达卖给新加坡一个季度销量77亿美金的1/5,我觉得把1/5运去中国还是很有可能的
j
jeffinvade
16 楼
美国有470万注册护士,中国是563万,但中国人口是美国4倍 美国每10万人31个ICU病床,中国只有4个 美国癌症五年存活率在70%,中国只是41%,农村更是只有22% 美国流感疫苗接种率60%,中国不到2% 我不是夸美国医疗体系,美国医疗昂贵效率低access差是臭名昭著的,我只是说中国医疗系统capacity其实是不如美国的,所以一个三甲医院的医生,一天要看50个病人。
j
jeffinvade
17 楼
医疗体系,有三个铁三角,access vs quality vs cost,三者不可兼得,只能三选二,只能牺牲一项来提高另外两项。中国是access+cost,牺牲quality。美国是牺牲cost
谁主沉浮?
18 楼
明天还要跌
清明风水
19 楼
5年?你想得太多了!最多5个月
妻妾成群1225
20 楼
中国人太坏了、把美国的最后一个裤衩子也给扒下来了……还再次伟大个屁!
e
eickegao
21 楼
deepseek不可能有5万块h100。5万块h100大概要15-20亿美金。deepseek有这么多钱吗?而且人家已经开源了,怎么弄的基本都透明了。 [1评]
e
eickegao
22 楼
meta号称有60万h100,如果5万就可以追上openai。那meta不是早就超过openai了?deepseek就是通过软件和数据优化的方式,使得不需要这么多硬件来堆叠效果。 其实给deepseek更多的gpu,也许deepseek的效果会大幅赶超openai。 [1评]
大春哥
23 楼
這仔是從班加鑼來的?
钻一
24 楼
不一定, 2048张H800 训练出来的话 说明许多小公司也能够做AI了 这岂不是增加了潜在用户数量 女大还不是得涨啊 [2评]
钻一
25 楼
人家是开源的 可以复制和验证 需不需要五万张一试便知 目前没有跳出来证伪的, 说明了什么?
路人丫丫
26 楼
呵呵。。。你真信的话就应该用真金白银来赌。你这底层不会不知道美股可以买跌的吧?🤣
起立致敬
27 楼
美国要是彻底把AI芯片禁了, 这企业也就嗝屁了。
j
jeffinvade
28 楼
Highflyer管理着80亿美金资产 花15亿问题不大 而且很可能只是用芯片,租的数据中心的时间/算力,并不拥有芯片
B
Big_Mac
29 楼
chinese chinese vs american chinese, hahaha!
j
jeffinvade
30 楼
AI更便宜,对很多公司是利好 比如苹果,比如salesforce, 比如service now,比如ACN 这些公司的data会有更多AI的应用,ROI会更高,会带来更大revenue 所以这些公司股票今天都在涨 但对芯片和核电/天然气公司来说可不是好事 就算Ai应用因此增加三倍,但训练所需算力只是之前的1/15-1/10,对英伟达的芯片需求和电力需求依旧会减少1/5-1/3
j
jeffinvade
31 楼
减少到目前预计的1/5-1/3
n
newgreatwall
32 楼
美国人五天工作,每天实干只有5小时, 其他时间都是喝咖啡、抽烟或者聊天。 而中国人的勤奋他们能够比上吗?
无聊师
33 楼
看看后续会有什么故事。
a
albertjia!
34 楼
狗粮说数据,狗粮主子粑粑都发笑,为啥呢,狗粮作为单细胞雌雄同体低等下贱畜生,最多就是吃屎闹肚子食物中毒,从来就没有去过医院啊,全凭想象来猜测呢。数据狗粮说说是不是今天没有吃到主子粑粑的隔夜大便很郁闷啊?
城市沉睡
35 楼
大家又一次见证了造谣是多么普遍。
f
flying72
36 楼
大的服务型公司,这轮下跌,顶多是前期投资打水漂,但可以从后期成本降低获益。初创AI公司真的是哀鸿遍野,尤其是研究算法的。 [1评]
今日雨果
37 楼
. 📍回复1楼:. “ 这个deepseek真的很厉害 AI里唯一懂政治的 你问他64它就跟你讲法律了” . 原形毕露,祸国殃民,呵呵😄哈哈😂 。 . 📍回复14楼:. 侬讲得蛮精辟👍 。 回答; 其实不用担心,只不过是聊天软件升级了而已。 。 . 📍[16楼]评论人:hotcpu [☆品衔R3☆] [个人频道] [个人动态] 发送时间: 2025年01月25日 9:47:26 【回复】 把技术的事留给技术吧,别往上套政治了。 deepseek 的技术优势是他的训练方法。 而这方法是基于蒸馏其他大模型而来的。 换句话说, 在其他大模型完成训练的基础上才有效。 这可以大幅降低进一步训练的成本。 但隐患是他的模型并不是从材料里直接训练出来的, 开源也许没问题, 一旦蒸馏被禁止,他的成本就会直线上升。 . . 📍[57楼]评论人:今日雨果 [☆品衔R4☆] [个人频道] [个人动态] 发送时间: 2025年01月27日 4:52:44 【回复】 回复37楼:“ 人类第几次尝试建巴别塔了,在ai这座塔上,基于其特殊的机制 -- 全是互相抄袭,永远在最高的那座塔上,继续往上建。 资本很拧巴,冲了不一定挣钱,不冲一定挣不到钱,结果就是还会拧巴的往里冲,虽然全世界心不齐,都互相想干掉对方,但是这座塔却还能在互相抄袭,改进,封锁,扭曲中越建越高,是福是祸?事情变得有意思起来了。” . 侬迭个观点、思考精神,很有意思,🤔 . 鹅呃观点:Je vois ce phénomène d'IA à la mode différemment|I see this trendy AI phenomenon differently | 我对这种时髦的AI 看法不同 见鹅下面另1个评论帖 . . 📍回复43楼:. 事实上,谷歌搜索引擎,比小雨开发的“知识搜索引擎”晚了20+年❗️ . 🌴🌳🌲 https://HugoAujourdhui.org/ ☞ 🕯️ ☞ 🤔😊 🌿Ce bébé du moteur de recherche est né N ans plus tôt (N = 20+) que le moteur de recherche Google Re: les meilleurs produits, ils ont presque toujours été conçus pour le bénéfice des personnes qui les construisent réellement ☞ 🍃 🍃 🍃 2024-12-18 🌿This Search engine baby was born N years earlier (N = 20+) than Google search engine was born Re: greatest products, they've almost always been designed for the benefit of the people who are actually building them ☞ 🍃 🍃 🍃 . . 回答: 来来来,老子给你们这些傻逼科普一下 美国搞了环球资源,中国抄袭搞了阿里巴巴 美国搞了搜索引擎谷歌,中国搞个百度 美国搞个谷歌地图,中国搞了百度地图 美国兴起电动车,中国也跟着 美国搞了优步打车,中国抄袭搞嘀嘀打车 美国搞ChatGPT 中国抄袭搞个deepseek 看明白了狗逼们? 抄袭的是人家的概念! 技术不怕你抄袭,但创新概念你是抄袭不去的! 要老子说,中国最牛逼的创意其实是团购! 其他的就别丢人现眼了 。 。
我已潜水很多年
38 楼
这哥们儿不知道昨天亏了多少,恨得牙痒痒吧,哈哈 反正中国人都很开心呢
今日雨果
39 楼
. 鹅觉得,AI目前赶时髦的做法,重点放得勿对,必须从基础性的东西做起。 🤔. 《Je vois ce phénomène d'IA à la mode différemment|I see this trendy AI phenomenon differently | 我对这种赶时髦的 AI 现象有不同的看法》 . Humanism-Q (HQ), my this invention in 2009 can lead AI walk out of the jungle, get rid of the "Law of the jungle". https://hugoaujourdhui.org/livre-blanc/philosophie/humanismeq-eq-iq-aq . Victor Universel Labo - VUL - 飞鸥实验室 V1.000.2025-01-26, 1989-06-04 Nice, Côte d'Azur、Paris, France . 回答: [60楼]评论人:flying72 [♂★★★飞翔的自行车★★★♂] [个人频道] [个人动态] 发送时间: 2025年01月27日 21:31:02 【回复】 回复11楼:大的服务型公司,这轮下跌,顶多是前期投资打水漂,但可以从后期成本降低获益。初创AI公司真的是哀鸿遍野,尤其是研究算法的。
b
bk59
40 楼
2048的是V3当时没什么动静。这两天火了的R1不知道
j
jujubi
41 楼
如果2048个GPU就可以训练出AI,连我都在认真考虑是否也搭建一个系统了。因此个人和小公司购买英伟达芯片数量会超过几个大公司。
j
jujubi
42 楼
程序开源但是数据不开源,这些数据从哪里来,怎样训练的信息不详。有人说是用了其他人工智能的数据。
寂寞de心
43 楼
问题不是有多少,而是用多少去完成
b
bodhidharma
44 楼
65楼吹吧,你买得起吗
L
LandShark
45 楼
没看懂, 这个就是说, “他说他家发动机的效率高, 但他们背地里囤了很多燃油”。 DeepSeek, 效率高40倍, 这跟有多少显卡,有鸡毛关系?
c
cedarbird
46 楼
算力可以买的,用比特币交易
f
firetoucher
47 楼
就Scale AI那种靠压榨非洲等第三世界极度低廉劳力来挣钱的公司,真的算不算高科技。
没有错
48 楼
开源了,不需要人人去买英伟达芯片,直接调用DS之类的开源基础就好。至于DS买哪家显卡,或买的到哪家显卡,就不清楚了 [1评]
j
jujubi
49 楼
A100在Ebay才买$4000.
j
jujubi
50 楼
也可以用云端的算力。
j
jujubi
51 楼
你对的,但是自己搭一套也很有成就感。
出自网络
52 楼
瞎扯啥呢,个不学无术的痞子,怎么抄袭不去创新概念? 。。。 灯塔的登月是原创概念吗? 中国的嫦娥奔月在战国时代就有了,过了2000年灯塔才抄袭了这个原创概念。
松泻
53 楼
台湾难波万,台湾难波万,台湾天下第一痈
犬涼不高兴
54 楼
狗粮们搞一个喷粪AI吧。无论输入任何话题,回答总能扯到骂中共,贬中国上,且套路灵活多样。
大秦帝国111
55 楼
英伟达都暴跌成那样了--说明股东们确认了梁文锋的DS用的就是本土AI高性能芯片,对于纳斯达克来说极其残酷的消息,但也得吞下这个事实。可这殖货还通过阴谋论替老黄掩耳盗铃地洗地,那张臭脸就写着一句哀嚎“中国大陆不可能有自己的高性能AI芯片,这不是真的!”
C
Claude_Z
56 楼
打不过,就暗示中国有芯片,寄希望于美国政府实施更加严厉的制裁。问题是这是靠制裁就能解决的问题吗?典型的打不过就喊爹帮忙
g
genhaoershi
57 楼
这个屄是个无耻汉奸
e
eickegao
58 楼
确实如此。
F
FuckTibet
59 楼
本来美国人想独享 AI , 现在中国人搞个开源,全世界大家谁便玩, 不管中国人多少钱搞出来的, 至少把 美国人想要的 AI 规划打乱,打破了, 呵呵