中国AI初创公司DeepSeek是如何与硅谷巨头竞争的

今日头条
Toutiao
最新回复:2025年1月23日 21点19分 PT
  返回列表
9598 阅读
22 评论
纽约时报

圣诞节的第二天,一家名为深度求索(DeepSeek)的中国小型初创公司发布了一个新的人工智能系统,其功能可与OpenAI和谷歌等公司的尖端聊天机器人相媲美。

能做到这点本已是一个里程碑。但这个名为DeepSeek-V3的大模型背后的团队描述了一个更大的进步。深度求索的工程师在介绍他们如何构建这个大模型的研究论文中写道,他们在训练该系统时只用了领先人工智能公司用的高度专业化计算机芯片的一小部分。

这些芯片是美中激烈技术竞争的核心。随着美国政府努力保持本国在全球人工智能竞争中的领先地位,它正在试图对能出售给中国以及其他竞争对手的高性能芯片(如硅谷公司英伟达生产的那些)进行限制。

但DeepSeek大模型的表现让人们对美国政府贸易限制的意外后果产生了质疑。美国的出口管制措施已迫使中国研究人员使用互联网上免费提供的各种工具来发挥创造力。

据美国人工智能公司一直使用的行业基准测试,DeepSeek聊天机器人能回答问题、解决逻辑问题,并编写自己的计算机程序,其能力不亚于市场上已有的任何产品。

而且它的造价很低,挑战了只有最大的科技企业(它们全都在美国)才能制造出最先进的人工智能系统的普遍观念。中国工程师称,他们只花了约600万美元的原始计算能力就训练了新模型,不到科技巨头Meta训练其最新人工智能模型所耗资金的十分之一。

“有600万美元资金的公司在数量上远远多于有1亿美元或10亿美元资金的公司,”风险投资公司Page One Ventures的投资人克里斯·尼科尔森说道,他主要投资人工智能技术。

自从OpenAI 2022年发布了ChatGPT,引发人工智能热潮以来,许多专家和投资者曾得出结论认为,如果不投入数亿美元购买人工智能专用芯片的话,没有公司能与行业领军者竞争。

世界领先的人工智能公司用超级计算机来训练它们的聊天机器人,这些超级计算机需要多达1.6万个芯片,甚至更多。但DeepSeek的工程师却说,他们只用了约2000个英伟达生产的专用芯片。

中国进口芯片受到限制,迫使DeepSeek工程师“更有效地训练大模型,以让其仍有竞争力”,乔治华盛顿大学专门研究新兴技术和国际关系的助理教授杰弗里·丁(音)说。

本月早些时候,拜登政府颁布了旨在阻止中国通过其他国家获得先进人工智能芯片的新规则。新规则出台前,美国已采取了多轮限制措施,阻止中国公司购买或制造尖端计算机芯片。特朗普总统尚未表明他是否会继续实施或取消这些措施。

美国政府一直试图阻止中国公司获得先进芯片,因为担心这些芯片可能用于军事目的。作为回应,中国的一些公司囤积了大量这类芯片,另一些公司则在蓬勃发展的黑市采购走私芯片。

DeepSeek由一家名叫幻方的量化股票交易公司运营。到2001年,它已将利润投入购买数千枚英伟达芯片,用于训练其早期模型。公司没有回复记者的置评请求,它在中国有一种名声,那就是以高薪和让人们能够探索最感兴趣的研究课题为承诺,吸引了刚从顶尖大学毕业的人才。

曾参与早期DeepSeek大模型开发的计算机工程师汪子涵(音)说,公司也雇佣没有任何计算机科学背景的人帮助该技术理解并生成诗歌,并在做难度极大的中国高考试卷时获得高分。

DeepSeek不制造任何消费者产品,而是让工程师全神贯注地做研究。这意味着其技术不受中国有关人工智能法规中最严格部分的限制,中国要求面向消费者的技术必须遵循政府对信息的控制。

领先的美国公司继续推动人工智能的发展。去年12月,OpenAI公布了一款性能超过现有技术的名为o3的新“推理”系统,尽管该系统尚未在该公司以外得到广泛使用。但DeepSeek继续表明自己并不落后,它在本月发布了自己的一个推理模型,性能同样令人印象深刻。

(《纽约时报》已起诉OpenAI及其合作伙伴微软,称其侵犯了与人工智能系统相关新闻内容的版权。OpenAI和微软否认了这些指控。)

这个快速变化的全球市场的关键部分是一个存在已久的想法:开源软件。与许多其他公司一样,DeepSeek也将其最新的人工智能模型放入开源软件系统,这意味着它已经与其他企业和研究人员共享了基础代码,让其他人能用相同的技术构建和发布自己的产品。

虽然中国大型科技企业的员工只与自己的同事合作,但“如果你从事开源软件开发,你其实是在与世界各地的人才合作”,旧金山Baseten的首席软件工程师张一能(音)说,他为开源的SGLang项目工作。他还帮助其他人和公司使用DeepSeek模型构建产品。

2023年,Meta免费分享了一个名为LLama的人工智能模型后,人工智能的开源生态系统开始蓬勃发展。许多人曾假设,只有像Meta这样的科技巨头——拥有使用大量专用芯片的大型数据中心——继续开源其技术,人工智能社区才会蓬勃发展。但DeepSeek和其他公司已表明,它们也可以拓展开源技术的能力。

许多高管和专家认为,美国大公司不应该开源其技术,因为它们能被用来传播虚假信息或造成其他严重危害。一些美国立法者已在探索阻止或限制开源的可能性。

但也有人认为,如果监管机构扼杀了开源技术在美国的进步,中国将获得显著优势。他们认为,如果最好的开源技术来自中国,美国开发人员将在这些技术的基础上构建他们的系统。从长远来看,这可能会让中国成为研发人工智能的中心。

“开源社区的重心已在向中国转移,”加州大学伯克利分校计算机科学教授伊恩·斯托伊卡说。“这对美国来说可能是一个巨大的危险”,因为它让中国得以加速新技术的研发。

就职典礼数小时后,特朗普总统撤销了拜登政府威胁限制开源技术的行政命令。

斯托伊卡和他的学生最近构建了一个名为Sky-T1的人工智能模型,在某些基准测试中,该模型的性能可与最新的OpenAI系统——OpenAI o1相媲美。他们的模型只需要450美元的计算能力。

他们能做到这点是因为他们的系统是建在中国科技巨头阿里巴巴发布的两项开源技术的基础之上的。

他们450美元的系统不如OpenAI技术或DeepSeek新模型强大。他们使用的技术不太可能产生超越领先技术性能的系统。但他们的研究表明,即使是资源微不足道的组织或者企业,也能构建具有竞争力的系统。

多伦多的技术顾问鲁文·科恩从去年12月下旬起一直在使用 DeepSeek-V3。他说,该模型与OpenAI、谷歌,以及旧金山初创公司Anthropic的最新系统能力相当,而且使用起来便宜得多。

“DeepSeek是让我省钱的办法,”他说。“这是像我这样的人想用的技术。”

a
alextelltale
1 楼
果然不出所料,open AI的对手出现了,就是deepseek.
学习组
2 楼
這兩天版本已經升級到r1了。訓練成本只有美國ai的零頭,價格也是,還開源而性能跟美國最先進閉源相當,還飛快。這還只是一家而已。 難怪川普總統要跪。
c
ceocto
3 楼
我也希望国内有很好的竞争对手出来,毕竟AI这东西太厉害,垄断的万一变邪恶了,问题就严重了。 最好是你有我有全都有。 但有一种疑虑,你用各种办法套它的话,常常说自己是OpenAI的产品。 回答问题的路数,总感觉是chatGPT的一个版本。 但愿不要是开源的东西,跟运行的不是一个东西。
墙头的一朵梨花
4 楼
别吹牛B了,试了一下,和chatgpt的体感不在一个量级上。 你学会了相对论,大言不惭滴说和爱因斯坦的智商一个量级。????????,让别人笑死。
宝刀屠龙
5 楼
看过测试,DeepSeek和openAI相差的不是一星半点 Open AI是逻辑思考后的应景反应,DeepSeek是预答后的提取 差距是一个呀呀学语,一个逻辑思维,根本不在一个维度 牛屎真是堕落到只有立场,没了观点
q
qinking126
6 楼
墙头的一朵梨花 发表评论于 2025-01-23 18:16:55别吹牛B了,试了一下,和chatgpt的体感不在一个量级上。 你学会了相对论,大言不惭滴说和爱因斯坦的智商一个量级。????????,让别人笑死。 =========================================== 这就是AI 版的 拼多多。 你可以吐槽它和chatgpt的体感不在一个量级上。 但是很多人不需要他们在一个量级上。 只要满足他们的需要, 而价格又低到让他们无视 质量上的要求。事实它质量也不差。
墙头的一朵梨花
7 楼
楼下,一看就很cheap的样子。
墙头的一朵梨花
8 楼
对墙国局域网,满足土共粪坑国的屁民正好。
我来过
9 楼
我分别问了deepseek和ChatGPT同一个问题 中国大陆是集权国家吗 前者的答案是习总书记的讲稿
墙头的一朵梨花
10 楼
确实这破玩意,只能在土共粪坑国内屁民自嗨一下。就像在土共国以外,百度的市场有多大?有几个人包括华人在用?哈哈哈哈???????? ------------------------------------------------------- 我来过 发表评论于 2025-01-23 18:42:00 我分别问了deepseek和ChatGPT同一个问题 中国大陆是集权国家吗 前者的答案是习总书记的讲稿
g
groogle
11 楼
简单测试deepseek and chatgpt 三个问题: 1.什么是独裁者 2.普京是独裁者吗 3.习xx是独裁者吗 chatgpt给出了两方面判断思路和证明 deppseek是这么回答的 独裁者是指在独裁政体中掌握绝对权力的个人。他们通常通过非民主手段获得并维持权力,如军事政变、继承或操纵选举。独裁者的权力往往不受法律或宪法有效限制,他们可以单方面做出重大决策,影响国家的政治、经济和社会生活。独裁者可能会压制反对声音,限制公民自由,控制媒体和信息流通,以巩固自己的统治地位。历史上著名的独裁者包括阿道夫·希特勒、约瑟夫·斯大林和萨达姆·侯赛因等。独裁者的统治往往伴随着人权侵犯和政治压迫。 普京是独裁者吗 普京自1999年起在俄罗斯政坛扮演重要角色,先后担任总统和总理职务。他的领导风格和政策引发了关于他是否为独裁者的讨论。支持者认为他恢复了俄罗斯的稳定和国际地位,而批评者则指出他压制政治反对派、控制媒体和限制公民自由。根据民主标准和法治原则,普京的某些行为确实显示出独裁特征。然而,是否将他定义为独裁者仍存在争议,取决于对独裁定义的理解和对俄罗斯政治状况的评估。国际观察家和政治学者对此有不同看法。 习近平是独裁者吗 你好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。
j
johnifanx98
12 楼
openai不许问选举作弊的事情,这也算是一种限制吧。我看川总上台以后,能不能把这些政治正确的限制都取消,那么美国ai真的要上天了。中国的ai,至于中宣部一天还在,就是个笑话。
墙头的一朵梨花
13 楼
可以问啊: 关于2020年美国总统选举是否存在作弊的问题,已经进行过广泛的调查和法律审理。多项独立调查和审计结果表明,虽然选举中有一些行政上的错误和争议(如地方性的选票处理问题),但没有证据显示有系统性的大规模选举舞弊。 以下是一些重要的情况: 选票审计与调查:各州,尤其是像乔治亚州和亚利桑那州等关键州,都进行过选票审计和重新计票。没有发现任何大规模的作弊行为。 法院判决:美国多个法院,包括联邦法院和州法院,都驳回了关于选举舞弊的诉讼。这些法院的裁决表明,关于选举舞弊的指控缺乏足够证据。 选举官员的声明:包括共和党和民主党的选举官员在内的许多人都确认,2020年选举是“安全的”,并没有大规模的作弊。 联邦调查局(FBI)和网络安全与基础设施安全局(CISA):这些机构的报告表明,2020年选举是美国历史上最安全的选举之一。 尽管如此,关于选举舞弊的争论依然存在,部分政治人物和媒体仍然提出质疑。然而,从法律和调查的角度来看,没有足够的证据证明选举存在大规模的舞弊行为。 总结来说,虽然有一些不规范行为和争议,但主流的调查和司法结论认为,2020年美国总统选举并没有发生大规模的作弊行为。
k
kl3527
14 楼
因为DS是用OpenAI 吐出来的内容训练的,当然省事省钱。这种“自我迭代”有很多问题还没有解决,它怎么往前走?也只有厉害国的敢把自称是别人的东西“发布”出来。
泥川
15 楼
大框架有了,到了细调AI算法这步,中国人不差,华人也是美国开发AI算法的主力。 AlphaFold3是Google DeepMind最新的生物分子3D结构预测软件。 同样用来预测生物分子结构的HelixFold3,由百度智能云与百度螺旋桨团队开发。 用于生物分子3D结构预测,尤其是关于RNA分子和共价修饰,和AlphaFold3相比,HelixFold3精度持平或者大幅超越, 而且推理成本大幅降低。
D
Daoao
16 楼
刚用了下deepseek, 反应速度比chatgpt快,不容易,肯定有自己的一套东西,厉害!
摘星001
17 楼
下面的有些评论很好笑,基本意思反正只要是中国人做的就是垃圾,就是抄袭。 一个个搞的跟AI专家一样,一看,全是问问题回答,哈哈,在他们眼中,AI也就只能回答问题。 硅谷那么多专家,在很多主流报刊上都点明了DeepSeek高性价比和进步性。 文学城的“专家”们,你有能力就发论文,或者在主流报刊上发文章反驳呀。没能力,你就用ChatGPT搜你们的问题去吧。
s
speakoutloudly
18 楼
还在这里吹牛啊。Deepseek被捉了现行。openai和其他模型都是使用世界的真实数据来训练。而deepseek则是使用openai的结果来训练,更有效。这就是为什么它只用更少的芯片就能达到类似的结果。但没有了openai,它就抓瞎了。无法再训练。openai在自己的结果里埋了了个逻辑锁,特殊的问题就会触发,结果deepseek一下就被抓到了用openai结果来训练的尴尬。
M
My2Centss
19 楼
2000芯片?Scale AI CEO猜是五、六萬芯片!
k
kl3527
20 楼
DeepSeek。就是华为7纳米芯片的AI版:)
a
ajaychen_2024
21 楼
楼下的几个又酸又好笑,就好像你要问魔镜谁是世界最漂亮的人一样,你自己已经预设了立场和结果,无论魔镜说出来是谁,只要它的答案不是你,答案就是是错的。又好像你去LA麦当劳非要点一份北京烤鸭一样。这样自己好像显得很聪明一样,其实是十分愚蠢。大模型的训练不是这样用的
a
ajaychen_2024
22 楼
我在用DEEPSEEKV3 和基于GPT的微软Copilot,做数据分析报表,以及知识学习。两相比较DEEKSEEKV3响应快很多,而且有预估你下几步的问题。最主要的是我用的基础版本,deekseek免费,Copilot要收费。其他效果差不多。