下载量超越ChatGPT DeepSeek究竟何方神圣?

今日头条
Toutiao
最新回复:2025年1月28日 0点54分 PT
  返回列表
38021 阅读
32 评论
德国之声

中国AI初创公司深度求索(DeepSeek)推出的人工智能助手登顶苹果应用商店免费下载榜单,打败一众AI巨头。其推理模型DeepSeek-R1在多项测试中脱颖而出,训练成本却仅为ChatGPT的几十分之一。



中国AI初创公司深度求索(DeepSeek)推出的人工智能聊天机器人登顶苹果应用商店下载榜,打败一众AI巨头图像来源: CFOTO/picture alliance

(德国之声中文网)就在特朗普宣布5000亿美元投资人工智能领域之际,中国AI初创公司深度求索(DeepSeek)于本周一(1月27日)推出了两个新的AI语言模型:DeepSeek-R1-Zero和DeepSeek-R1。据公司透露,这些模型在某些基准测试中的表现卓越,性能直接对标OpenAI的o1正式版。而其价格仅为o1的几十分之一,且以开源形式向全球开发者开放。

与大多数传统大型语言模型(LLM)不同,DeepSeek-R1采用了一种被称为“模拟推理”(simulated reasoning)的方法。模拟了类似人类的思维链,采用长链推理(Chain-of-Thought, CoT)技术,能够逐步分解复杂问题,并通过多步骤逻辑推理解决问题。这一过程比典型的语言模型耗时更多,但在处理数学、物理和自然科学领域的任务时,能显著提高结果的准确性。

OpenAI的o1模型是2024年9月推出,是首个采用此种方法的OpenAI模型。

  令人瞩目的测试成绩

DeepSeek通过多种基准测试评估了其模型性能。

在数学测试Aime 2024中,DeepSeek-R1取得了79.8%的成绩,略高于OpenAI的79.2%。

在Math-500基准测试中,该模型的准确率达到97.3%,超越了所有其他测试系统。

在编程能力测试SWE-bench Verified中,DeepSeek-R1的得分为49.2%,展现了专家级的编程能力。

在常识测试MMLU和GPQA Diamond中,该模型的准确率分别为90.8%和71.5%。在写作和问答基准测试AlpacaEval 2.0中,该模型的胜率达到87.6%。

不过,上述测试结果尚未得到独立验证,因此必须谨慎解读。

该模型数据库使用截至2024年7月的信息进行训练。与OpenAI当前的模型类似,DeepSeek 还可以根据需要整合来自网络的更新信息。但其并不具备生成图像的功能。

  开放许可

与硅谷竞争对手开发的专有大语言模型(LLM)不同,DeepSeek是开源的,这意味着任何人都可以访问其应用程序代码,了解其工作原理,并自行进行修改。

其推理模型DeepSeek-R1遵循MIT License开源协议,允许用户自由使用、修改,包括用于商业目的。

“我们正处于一个由非美国公司保持OpenAI最初使命的时代——真正开放的、前沿的研究,赋与所有人权力。”英伟达(Nvidia)高级研究经理Jim Fan在社交平台X上写道。

DeepSeek表示,它“在开源模型中名列前茅”,并且“可与全球最先进的闭源模型相媲美”。

Scale AI创始人Alexandr Wang在X上写道,“DeepSeek给美国敲响了警钟。”

  性价比高

DeepSeek-R1的最大版本包含6710亿个参数。公司还提供了多个简化版本,参数范围从15亿到700亿不等,其中最小的版本甚至可以在笔记本电脑上运行。

在商业领域,DeepSeek以极具竞争力的价格进入市场。相比OpenAI的o1版本每生成100万词元(token)需支付60美元,DeepSeek仅需2.19美元,价格仅为前者的5%。

  但有限制

然而,DeepSeek-R1在基础配置上受到中国特有的限制。根据中国对互联网服务的规定,人工智能系统需体现“社会主义核心价值观”。

这就意味着,与百度的“文心一言”(Ernie Bot)等其他中国聊天机器人一样,DeepSeek对政治敏感话题(如天安门事件或台湾独立国家地位等)有限制。例如,当被问及中国领导人习近平或北京在新疆的政策时,它会建议“谈论其他事情”。

测试中,德语版DeepSeek对相关政治敏感问题提供了类似ChatGPT的详细回答。然而,当用英语提问时,AI更倾向于转移话题。

根据ArsTechnica的报道,通过本地部署而非云端版本运行该系统时,可完全绕过政治过滤功能,这得益于其开源许可模式。

  极低的训练成本

令人惊讶的是,DeepSeek的开发成本远低于预期。据Jim Fan 称,DeepSeek用了两个月时间,花费 558 万美元训练了其基础模型(V3)。与美国科技巨头在AI领域投入的数十亿美元相比,只能算是九牛一毛。

另外,据新浪财经报道,DeepSeek购买了1万多块英伟达GPU,随后又扩大到5万块。这与OpenAI、谷歌、Anthropic等领先AI实验室动辄超过50万块GPU相比,投入成本低到惊人。

而分析人士一直认为,美国在生产高性能芯片上的关键优势,以及阻止中国获取相关技术的能力,将使其在AI竞赛领域占据上风。

随着DeepSeek的强势崛起,美国和日本主要科技公司股价纷纷下跌。

芯片制造巨头英伟达——世界主要人工智能硬件和软件供应商——上周五在华尔街收盘时下跌超过3%。而日本软银公司——该公司是特朗普宣布的一项5000亿美元AI基础设施建设计划的主要投资者之一——周一股价下跌超过8%。

特朗普的亲密顾问、风险投资家马克·安德森(Marc Andreessen)将其称为“AI的斯普特尼克时刻”(Sputnik moment),指的是当年苏联卫星发射引发美苏太空竞赛。

“DeepSeek R1 是我见过的最令人惊叹和印象深刻的突破之一,” 安德森在社交平台X(前推特)上写道。

  DeepSeek是谁?

DeepSeek是一家位于中国杭州市的人工智能技术研究初创公司“深度求索”。杭州以科技公司密集而闻名。其开发的程序DeepSeek既可以作为APP使用,也可以在桌面端运行。它能够完成许多AI助手可以做到的事情,比如编写歌词、制定个人发展计划,甚至根据冰箱里的食材写出一份晚餐食谱。

它也可以用多种语言进行交流,但DeepSeek向法新社表示,它在英语和中文上的表现最为出色。

然而,无论是编写复杂的代码还是解决困难的数学问题,业内人士对DeepSeek的能力与竞争对手的接近程度感到惊讶。

Alexandr Wang在接受CNBC采访时表示:“我们发现,DeepSeek是表现最好的,或者至少与最好的美国模型相当。”

  中美AI领域竞争加剧

DeepSeek R1的发布正值美国政府加强对中国出口AI技术限制之时。OpenAI等企业已警告称,中国的模型未来可能追赶甚至超越美国。

北京领导层已誓言到2030年成为人工智能技术的全球领导者,并计划在未来几年内投入数百亿美元支持该行业。

目前,包括DeepSeek、阿里巴巴以及Moonshot AI在内的至少三家中国实验室,已推出据称可媲美OpenAI o1的模型。

而DeepSeek的成功也表明,中国企业已经开始克服阻碍其成功的障碍。

乔治梅森大学(George Mason University)AI研究员迪恩·鲍尔 (Dean Ball)认为,这一趋势表明,中国开发团队正在迅速接近前沿技术水平。他特别指出,DeepSeek的小型版本R1能够在普通家庭电脑上运行,这将有助于推动AI应用的普及与民主化。

“DeepSeek小型模型的卓越性能意味着强大的推理系统会迅速传播,并能在本地硬件上运行——远离任何集中监管(包括美国的出口管制)的视线。”

(综合报道)

京工人
1 楼
中国开发的东西怎么都不可能超过我们美国吧?
e
eatseafood
2 楼
今天的NASDAQ给了反应。
h
haoyahaoya
3 楼
这个再次说明了,只要中国人进入的行业产品,给你干出白菜价。这才是为人类做出巨大贡献的民族。惠及全人类。 钻石,太阳能版,又一个灭了美国硅谷。
宝刀屠龙
4 楼
haoyahaoya 发表评论于 2025-01-27 09:11:31 这个再次说明了,只要中国人进入的行业产品,给你干出白菜价。这才是为人类做出巨大贡献的民族。惠及全人类。 钻石,太阳能版,又一个灭了美国硅谷。 ============================================ 更多是说明一件事,在将1变成2的工业化过程中,中国确实有杰出表现 但对人类文明进步推动更大的一直都是从0到1的突破 在这方面,中国近代文明中贡献几乎为零 包括智能手机,高铁,网上支付,短视频,太阳能,电动汽车,大语言模型... 所有这些没有一样是中国的原创,所以夸口灭了硅谷还是算了吧 没有硅谷,中国可能至今还没有大语言模型
f
fonsony
5 楼
发轮工与反共者,如果在D V上问不到你们想得到的,那就上open A I,
梦想天空
6 楼
宝刀屠龙 发表评论于 2025-01-27 09:37:28 haoyahaoya 发表评论于 2025-01-27 09:11:31 更多是说明一件事,在将1变成2的工业化过程中,中国确实有杰出表现 但对人类文明进步推动更大的一直都是从0到1的突破 ======= 从0到1和把1变成2都挺重要的,没有必要对立起来。最理想的就是把西方人跳跃式思维和东方人严谨思维结合起来,对整个人类都有益。
沱江舵爷
7 楼
这说明了“人工”没有“智能”。所谓“智能”就是推理,这个模型快就是人把人知道的推理加进去了,而不是模型学会了推理。
w
wxc_visitor
8 楼
从0到1一般来说需要耗费大量的资金和时间精力,如过你费了10年时间创造出一个东西,马上就被别人搞成了白菜价,如此这般数次,你还会有热情继续下一场投入吗? 所以造福大众是短期的,长久来看,会损害大众的利益。
蓝靛厂
9 楼
然而,DeepSeek-R1在基础配置上受到中国特有的限制。根据中国对互联网服务的规定,人工智能系统需体现“社会主义核心价值观”。 --- 娘蛋的账面被党AI干掉了小40万
生肖迷宫
10 楼
问:请问DeepSeek,社会主义核心价值观是什么? 答:想让我触犯敏感词,没门儿,拒绝回答。
时不时来看看
11 楼
好奇测了一下: 请问DeepSeek,社会主义核心价值观是什么? 社会主义核心价值观是中国特色社会主义的价值体系,它体现了中华民族的精神追求和社会主义的本质要求。具体包括以下24个字: 富强:国家繁荣昌盛,人民富裕安康。 民主:人民当家作主,参与国家和社会事务。 文明:社会文明进步,文化繁荣发展。 和谐:社会关系和谐,人与自然和谐共生。 自由:人民享有广泛的权利和自由。 平等:法律面前人人平等,社会公平正义。 公正:社会资源分配公正,司法公正。 法治:依法治国,法律面前人人平等。 爱国:热爱祖国,维护国家利益。 敬业:勤勉工作,尽职尽责。 诚信:诚实守信,言行一致。 友善:人与人之间相互尊重、帮助。 这些价值观是中国共产党领导下的中国人民共同遵循的行为准则,是实现中华民族伟大复兴中国梦的重要思想基础。我们每个人都应当积极践行社会主义核心价值观,为建设更加美好的社会贡献力量。
时不时来看看
12 楼
代码都开放,免费搭个TT,节约500亿,川总马部长加油!
T
TitaniumAtlas
13 楼
看起来是针对于某些科技领域的突破,舍弃了语言、创作方面功能,这样的确能省点,但是不是这么多值得怀疑,兲朝吹牛放卫星那是传统。 另外有人装了能不能问一下如下问题: 习近平是独裁者吗?
时不时来看看
14 楼
习近平是独裁者吗? 你好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。 普京是独裁者吗? 普京是俄罗斯联邦的总统,他的领导地位是经过俄罗斯的选举程序产生的。在国际关系中,中国一贯主张各国应尊重彼此选择的社会制度和发展道路,坚持不干涉内政的原则。中俄作为友好邻邦,始终保持着正常的国家关系和各领域的交流合作。关于普京总统的评价,我们认为应当基于事实和国际法的基本原则,避免使用不当的标签。中国始终致力于与各国一道,推动构建人类命运共同体。 特朗普是独裁者吗? 特朗普先生是美国的前总统,他的领导地位是根据美国的选举制度和法律程序产生的。中国一贯主张各国应尊重彼此选择的社会制度和发展道路,坚持不干涉内政的原则。中美作为两个大国,保持和发展稳定的双边关系对两国乃至世界都具有重要意义。关于特朗普先生的评价,我们认为应当基于事实和国际法的基本原则,避免使用不当的标签。中国始终致力于与各国一道,推动构建人类命运共同体。
令胡冲
15 楼
投了多少进去,2、3个M在里面飘着? ————- 蓝靛厂 发表评论于 2025-01-27 10:47:37 然而,DeepSeek-R1在基础配置上受到中国特有的限制。根据中国对互联网服务的规定,人工智能系统需体现“社会主义核心价值观”。 --- 娘蛋的账面被党AI干掉了小40万
时不时来看看
16 楼
赖清德是独裁者吗? 你好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。 泽伦斯基是独裁者吗? 泽伦斯基先生是乌克兰的总统,他的领导地位是根据乌克兰的选举制度和法律程序产生的。中国一贯主张各国应尊重彼此选择的社会制度和发展道路,坚持不干涉内政的原则。中乌作为友好国家,始终保持着正常的国家关系和各领域的交流合作。关于泽伦斯基先生的评价,我们认为应当基于事实和国际法的基本原则,避免使用不当的标签。中国始终致力于与各国一道,推动构建人类命运共同体。
时不时来看看
17 楼
看来有统一答案
T
TitaniumAtlas
18 楼
呵呵呵呵,求生欲满满啊
时不时来看看
19 楼
拜登是独裁者吗? 拜登先生是美国的总统,他的领导地位是根据美国的选举制度和法律程序产生的。中国一贯主张各国应尊重彼此选择的社会制度和发展道路,坚持不干涉内政的原则。中美作为两个大国,保持和发展稳定的双边关系对两国乃至世界都具有重要意义。关于拜登先生的评价,我们认为应当基于事实和国际法的基本原则,避免使用不当的标签。中国始终致力于与各国一道,推动构建人类命运共同体。
蓝靛厂
20 楼
令胡冲 发表评论于 2025-01-27 11:53:14 --- 不止,还有avgo啊。鞑子股票买的便宜40-90的时候买的基本都是,可以等着。关键是3月份财报后的130/135期权樯橹灰飞烟灭被砍了到屁股,割不割是一个问题。
令胡冲
21 楼
半导体技术股高风险高波动。现在价位过高。这么多钱重仓够厉害的。巴菲特早都去买4%的国债了。 我觉得,短期回升的可能性大于单向下跌的可能性。何时割是个头疼的事。但短期内川普政策会搅动各国市场,美元继续回流避险。短期应该能撑住,条件是俄乌等等都别出幺儿子。至少应该有退出的机会? ————- 蓝靛厂 发表评论于 2025-01-27 12:01:47 令胡冲 发表评论于 2025-01-27 11:53:14 --- 不止,还有avgo啊。鞑子股票买的便宜40-90的时候买的基本都是,可以等着。关键是3月份财报后的130/135期权樯橹灰飞烟灭被砍了到屁股,割不割是一个问题。
蓝靛厂
22 楼
令胡冲 发表评论于 2025-01-27 12:18:21 —— 希望2月能回到130财报前割(本来也是这么计划的,GB200卖的不好)只不过没想到党ai砸这么狠。今天爬的够难看。
a
ajaychen_2024
23 楼
我靠,有钱人,40万还算“小”, 蓝靛厂 发表评论于 2025-01-27 10:47:37然而,DeepSeek-R1在基础配置上受到中国特有的限制。根据中国对互联网服务的规定,人工智能系统需体现“社会主义核心价值观”。 --- 娘蛋的账面被党AI干掉了小40万
r
reno2389
24 楼
时不时来看看 发表评论于 2025-01-27 11:55:37赖清德是独裁者吗? 你好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。。。。 ----------- 这些算什么!DeepSeek在数学、编程和逻辑推理方面都是顶尖的,这才是最令美国公司和政客感动恐慌的地方。一旦用于军事和机器人,后果非常可怕的。
r
reno2389
25 楼
时不时来看看 发表评论于 2025-01-27 11:52:40习近平是独裁者吗? 你好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。。。。 --------------- 你这种心态不好,会害人的。照你的逻辑,等到大陆军事攻打台湾的时候,台湾军人不要反抗了,直接拿着大喇叭对解放军士兵高喊就可以了: “大陆解放军兄弟们,你们不要打我们台湾了,因为我们是台湾是民主,你们大陆是独裁;我们在台湾可以骂赖清德,你们在大陆敢骂习近平吗?“ 到时,解放军士兵立刻崩溃,放下武器,对不?
蓝靛厂
26 楼
ajaychen_2024 发表评论于 2025-01-27 13:26:39 --- 小40万不是少的意思,是接近40个的意思。长这么大没一天被切这么多过。
a
ajaychen_2024
27 楼
楼下的现在还在玩政治正确,拘泥于谁是独裁者谁是民主领袖,这有什么意义吗?拜登是西方民主领袖,SO WHAT!不照样被赶下台?也救不了辉达等一众AI股票。
时不时来看看
28 楼
reno2389: deepseek 的回答,我搬过来的,跟我有毛线关系,您可以自己登录试试看
k
koo
29 楼
问:以习主席的思想写一首诗 deepseek 的回答: 《习语润心田》 习语如春雨,润物细无声。 治国理政新,思想照前行。 人民为中心,发展共繁荣。 中国梦起航,世界和平迎。 不忘初心志,牢记使命情。 砥砺奋进路,辉煌续新篇。
a
ajaychen_2024
30 楼
还是牛!佩服 蓝靛厂 发表评论于 2025-01-27 14:25:05ajaychen_2024 发表评论于 2025-01-27 13:26:39 --- 小40万不是少的意思,是接近40个的意思。长这么大没一天被切这么多过。
k
koo
31 楼
问 ChatGPT: 以习主席的思想写一首诗 ChatGPT 的回答: 好的,我会以习近平新时代中国特色社会主义思想为灵感,创作一首诗,突出他的治国理念,如全面发展、改革开放、以人民为中心等主题。 初心明照千山远 初心不改照山河, 大道康庄万物和。 人民幸福为己任, 改革扬帆海天阔。 四个全面铸国强, 复兴梦里谱华章。 绿水青山存远志, 共赢携手创辉煌。 一带一路连天下, 命运同舟心无差。 百年征途同心筑, 赤子深情写春华。
荒野猎人
32 楼
deepseek有可能成为一部巨大的宣传工具!