半导体研究机构:DeepSeek硬件投资或逾5亿美元

今日头条
Toutiao
最新回复:2025年2月2日 17点39分 PT
  返回列表
39410 阅读
26 评论
香港01





中国人工智能(AI)公司DeepSeek推出的新模型DeepSeek-R1因性价比高而广受关注,成本多少成为外界焦点,半导体研究机构SemiAnalysis发表报告,估计DeepSeek公司历年来的硬体投资支出为远高于5亿美元。

DeepSeek在2024年12月公布的文件中,透露其模型DeepSeek V3的训练成本为557.6万美元,低廉的成本引起关注。文件注明成本仅包括V3的官方训练(official training),不包括与架构、演算法或资料相关的先前研究和消融实验(ablation experiments)的成本。

半导体研究与谘询机构SemiAnalysis发表报告,估计DeepSeek公司的历来硬体投资支出为远高于5亿美元,并指研发成本和整体成本也相当可观,称为模型训练制作“合成资料”需要大量的计算力。

报告称“为开发新的架构方法,在模型开发过程中,需要花费大量资金来测试新想法、新的架构理念和消融(ablations)。”

2023年时,外界估计OpenAI的GPT-4训练成本达到6300万美元。

糖醋鲤鱼
1 楼
废话,硬件成本是一次性投资,训练成本才是体现训练模型的水平和效率。
l
linglang2012
2 楼
deepseek通过非正常第三方渠道在新加坡购买大量英伟达高端芯片,英伟达不可能不知道(双方默契)。为了掩盖其行为,为了保护英伟达不受美国政府处罚,deepseek故意大幅缩小其购买的芯片量,宣称只买一点点就达到效果了。黄老板想黑白通吃。
佚名未名
3 楼
*如果*真的是故意少报了,那么NV被做空的损失是不是可以起诉DS找回?操纵股票市场?这和正常做空有区别的吧。
蓝靛厂
4 楼
楼下不用起诉了。周五我们敬爱的总统砸空了所有股票包括他自己的DJT。全世界空头弹冠相庆啊。真是空头们贴心的好总统
蓝靛厂
5 楼
幻方量化有超过1万块A100,他自己宣称有2048个H800。不计算其他正本以及任何走私的可能。GPU成本1.7 亿美子。服务器相关的配套设施加机柜,三亿是有的。如果按传闻的走私了5000块H100,那10亿美子是最起码的
s
souledgeii
6 楼
人家自己的paper里说的明明白白的只是训练成本,有啥隐瞒的,用2000块也不是说都用了,其余的估计在训练v4呢
宝刀屠龙
7 楼
糖醋鲤鱼 发表评论于 2025-02-02 08:47:31 废话,硬件成本是一次性投资,训练成本才是体现训练模型的水平和效率。 ============================================ 在董事会关上门怎么算成本和效益其实是自己的事外人无权置喙 但拿chatGPT做对比宣传时,自己用单纯的训练成本,将ChatGPT的成本打包 得出自己是chat GPT几十甚至是百分之一,这就是欺骗嘛 如果按照全投资成本和最终产出,效率比ChatGDP高的就没那么夸张 当然,商场阿谀我诈是常态,但也不会是完全没后果的 deepseek这事情的最终后果还要等等才能看得到,毕竟美国做事不会那么快,等着看吧
左岸右岸
8 楼
五亿美元的弯道超车费。
会当凌绝顶1
9 楼
会当凌绝顶1 发表评论于 2025-02-02 06:38:28 网友 te-you-li 评论:某些人一方面尔虞我诈,一方面又沉浸在虚妄的自豪之中,其中不乏吹捧DeepSeek的自嗨。最经典的,就是某些人对抄袭、剽窃、盗用Chat GPT等数据、模型和结果的行为不做反思,不以为耻,反以为荣!“套壳”、“蒸馏”成为热门、流行新词汇。 但套壳和蒸馏最终的社会等价模型,我认为,就是“AI地沟油”。当全球AI体系都对“套壳”和“蒸馏”都加以防范时,套壳也好,蒸馏也罢,有深度、有价值的信息,能套能蒸的就会像地沟里的油那样,充满了杂质和有害物质。套壳、蒸馏就必然与地沟油的提炼异曲同工。 当AI的概念充斥大脑,我猛然意识到,AI必然会具有社会的基因属性。因为AI也是被特定社会里的特定人群所训练的。其中必定承载了这个社会的科技水平、文化特色、以及全方位的价值观体系。毋庸置疑,套壳或蒸馏别人的AI资金和产品,必然会对其中的文化及价值观进行适配性的阉割甚至歪曲。而对于科学技术,靠套、靠蒸、靠偷也不会得到最先进的技术理论和思想成就。而一旦一个社会沉湎于套壳、盗窃他人科技成果后,便会进入到自我弱智化的进程。一方面对自己的投机取巧暗中窃喜和洋洋得意。
会当凌绝顶1
10 楼
据报道,“针对DeepSeek是否通过在新加坡的中间人获取受到美国出口管控商品英伟达芯片一事出现了一些疑问,”彭博社援引新加坡贸易与工业部发表的声明说。 硅谷AI行业一名高管日前对美国财经电视频道CNBC透露,DeepSeek拥有英伟达人工智能高级芯片H100五万片!
会当凌绝顶1
11 楼
+100 蓝靛厂 发表评论于 2025-02-02 09:16:22 幻方量化有超过1万块A100,他自己宣称有2048个H800。不计算其他正本以及任何走私的可能。GPU成本1.7 亿美子。服务器相关的配套设施加机柜,三亿是有的。如果按传闻的走私了5000块H100,那10亿美子是最起码的
牛羊满仓
12 楼
+200,仔细了解一下就知道,500万美元可能就是个电费。 -------------------------------------------------- 会当凌绝顶1 发表评论于 2025-02-02 10:13:27+100 蓝靛厂 发表评论于 2025-02-02 09:16:22 幻方量化有超过1万块A100,他自己宣称有2048个H800。不计算其他正本以及任何走私的可能。GPU成本1.7 亿美子。服务器相关的配套设施加机柜,三亿是有的。如果按传闻的走私了5000块H100,那10亿美子是最起码的
裘千里
13 楼
投资五亿就有这么大的效果,要是投资五十亿,美国岂不是没戏唱了?
b
bsmile
14 楼
5亿人民币还有可能
L
LISP
15 楼
训练成本应该主要是电费
时不时来看看
16 楼
真无聊,人家把代码,权重,结果都给你了,用自己的数据和老的NVIDIA GPU重新训练一下看看结果是不是接近不就完了?
R
ROUTARD
17 楼
中国说我们人均鸡的屁1万美元。 美国说不对,你们人均5万美元。即使5万美元,还是比不过我们美国10万美元。
a
akuan
18 楼
AI 每天都有创新, DS最近做的也属于这种创新,但步子大一点。这是在前人基础上的创新,不是从零到一的创新。最近这件事更多地像一场市场营销,有一众吹鼓手在摇旗呐喊,并且不排除政治介入。
时不时来看看
19 楼
我就不信Meta,openai,微软,甚至Nvidia拿着Deepseek的结果不重新训练自己的数据就用,5.6米对3家中的任何一家都是一杯coffe而已,或者一个吹牛高管的年薪
l
ljcn
20 楼
那个paper是没有peer review过的 自己想怎么说,怎么说 souledgeii 发表评论于 2025-02-02 09:37:25 人家自己的paper里说的明明白白的只是训练成本,有啥隐瞒的,用2000块也不是说都用了,其余的估计在训练v4呢
京城老炮1950
21 楼
深度求索的许多技术在业界早已存在,并且已经在谷歌、Meta、OpenAI 等实验室中被研究甚至应用。真正让深度求索引发全球轰动的原因,或许并不是技术本身,而是: 其一,它是一家中国公司——在中美 AI 竞争的背景下,任何来自中国的 AI 突破都会受到更大的关注。 其二,开放权重的策略——V3 和 R1 是领先的开放权重模型,使得全球 AI 研究人员和开发者能够直接使用,而不像 GPT-4 这样的封闭模型。这种策略让深度求索在开源社区内迅速积累声望。 其三,低成本宣传的误导——600 万美元的训练成本成为媒体炒作的噱头,但忽略了更广泛的研发投入,使其看起来比西方实验室更“高效”。 其四,新范式的营销——强化学习+合成数据优化推理能力的范式并非深度求索独有,但他们成功地让市场相信这是一场变革,而 OpenAI 和谷歌早已使用类似方法。
人在旅途2024
22 楼
560万美元成本就是个神话性质的笑话。。 和当年亩产万斤性质差不多,把其他稻田里的收成都堆到一块田里,这里是把所有前期成本都不计算在内了
新燕山夜话
23 楼
就算“DeepSeek硬件投资或逾5亿美元”,那也比OpenAI、谷歌、Meta等美国AI大户的投资小得多。5亿美元硬件投入,加上六百万美元的训练成本,还是不到六亿美元,比ChatGPT的成别还是低多了。DeepSeek R1的免费开源,让OpenAI、谷歌、Meta等AI大户垄断挣大钱的梦想彻底成空。
_
___1984___
24 楼
说DeepSeek成本比美国的便宜很多,这很正常。 但牛皮吹得太吓人,失去逻辑,引起大家质疑就起反作用了。
白云蓝天
25 楼
本人早就认为 DeepSeek 应该是属于站在巨人肩膀上的自我创建的人工智能软件,但成本600万绝对是谎言,另外它很大概率使用了被美国禁止中国购买的硬件。
s
southkeys
26 楼
500万美元电费吧,其他固定资产投资都不算