超越ChatGPT登顶!中国“神秘力量”由杭州公司开发

今日头条
Toutiao
最新回复:2025年1月27日 8点44分 PT
  返回列表
80500 阅读
35 评论
19楼/牲产队

近日,国产AI DeepSeek在中国、美国的科技圈受到广泛关注,甚至被认为是大模型行业的最大“黑马”,在外网,DeepSeek被不少人称为“神秘的东方力量”。1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。

苹果美国区应用商店

苹果APP Store中国区免费榜

1月27日相关微博热搜刷屏

游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果。

DeepSeek是啥?

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。

去年12月DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发贴称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。

据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。这一模型发布后,引发了海外AI圈众多科技大佬的讨论。例如,英伟达高级研究科学家Jim Fan就在个人社交平台上公开发表推文表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”

图源:证券时报

DeepSeek为何突然爆火?26日,DeepSeek出现了短时闪崩现象。不少网友反映,使用时遇到 “服务器繁忙” 的提示。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。不过,官方状态页并未将这一事件标记为事故。

据了解,此前DeepSeek在美区榜单的排名并无特别突出表现,处于稳步上升阶段,但未进入前十。此次突然蹿升,与其近期一系列突出表现有直接关系。

据报道,“DeepSeek爆火的原因主要可以归结为两点:性能和成本。”萨摩耶云科技集团首席经济学家郑磊告诉媒体。DeepSeek解释称,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。这种卓越的性能不仅吸引了科技界的广泛关注,也让投资界看到了其巨大的商业潜力。

更为关注的是,DeepSeek R1真正与众不同之处在于它的成本——或者说成本很低。DeepSeek的R1的预训练费用只有557.6万美元,仅是OpenAI GPT-4o模型训练成本的不到十分之一。同时,DeepSeek公布了API的定价,每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。这个收费大约是OpenAI o1运行成本的三十分之一,也因此,DeepSeek被称为AI界的“拼多多”。

郑磊直言,DeepSeek对硬件市场产生了重大影响,因为它可能会降低人工智能模型的硬件成本,从而推动人工智能技术的发展。

团队不到140人都来自国内顶尖高校DeepSeek之所以能取得这些创新并非一日之功,而是“孵化”数年之久,长期谋划后的结果。DeepSeek创始人梁文锋也是头部量化私募幻方量化的创始人。Deepseek充分利用了其幻方量化积累的资金、数据和卡。

梁文锋本科、研究生毕业于浙江大学,拥有信息与电子工程学系本科和硕士学位。2008年起,他开始带领团队使用机器学习等技术探索全自动量化交易。2023年7月,DeepSeek正式成立,进军通用人工智能领域,至今从未对外融资。此前,OpenAI前政策主管、Anthropic联合创始人Jack Clark认为DeepSeek雇用了“一批高深莫测的奇才”,对此,梁文峰在接受自媒体采访时曾透露过,并没有什么高深莫测的奇才,都是来自Top高校的毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。

从目前已有的媒体公开报道中可以看出,DeepSeek团队最大的特点是名校、年轻,即使是团队Leader级别,年纪也多在35岁以下。不到140人的团队,工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,工作时间都不长。

DeepSeek核心成员是应届生

出色的成就与其团队规模形成了鲜明的对比。根据公开报道,DeepSeek的员工规模不及OpenAI的1/5,百人出头的公司中,算子、推理框架、多模态等研发工程师以及深度学习方面的研究人员共有约70人,主要在北京分部,其余30多人在杭州总部,多为前端、产品以及商务人员。

让人惊奇的是,这家公司内并没有外界推论的高深莫测的奇才。DeepSeek创始人梁文锋曾透露,员工都是一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。他说,在人工智能领域,“前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。”

在梁文锋看来,在这一波人工智能的浪潮中,DeepSeek的出发点,不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。他说:“过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。”

开年最大黑马,DeepSeek凭什么打爆美国科技圈?

一家名为“深度求索”的中国AI公司,打爆了美国科技圈。只因为它开源了一款AI工具:DeepSeek。其实,这已经是DeepSeek第二次震撼美国了。差别在于,这一次的震撼程度更大。

上一次是去年底,DeepSeek发布V3版本,首次跻身全球一流水平,但与OpenAI,DeepMind还有着明显的差距。可当它迭代到R1版本时,它与OpenAI的技术差距已经非常小了。甚至,在部分技术领域,DeepSeek已经追上ChatGPT了。可你要知道,任何AI工具都离不开强大的算力支持。为了限制中国的AI技术发展,美国对中国实施了全面的AI算力芯片封锁。DeepSeek是怎么做到后来居上的呢?这主要有三大原因:

一是,深度求索公司不缺钱。他的创始人名叫梁文锋,出生于广东湛江,这是一个典型的三四线城市。梁文锋呢?也是一个传统意义上的小镇做题家。他凭借优异的成绩,17岁时考入浙江大学,于2010年,在浙大信息与通信工程专业硕士毕业。从这一刻开始,梁文锋就走向了截然不同的职业路径。他没有去打工,而是与同学一起创立了雅可比投资,一头扎进了金融行业。

在积累了第一桶金以后,5年以后,梁文锋30岁,与徐进联合创立了“幻方量化”对冲基金。什么是量化基金呢?就是通过海量的高频交易,打时间差,哪怕只有5毛钱的利润,它也能海量吃进,在成千上万次交易中,获取巨额利润。而“幻方量化”最大的不同就在于,它从一开始,就立志于使用AI工具,实现全自动量化交易。

也就是说,你在炒股的时候,你的对手不是人类,而是“幻方”量化打造的超级AI,它的准确率超过80%。在强大的AI支持下,“幻方量化”管理的基金规模,迅速突破1000亿,跻身中国头部基金。这些基金投资所带来的巨额收益,让深度求索从一开始,就完全不缺钱。

深度求索在打造DeepSeek的时候,不追求盈利,也不考虑商业化变现,以一种近乎纯粹的科研氛围,招募了一大批顶尖人才。这样做的好处是,它的员工可以心无旁骛地搞定技术,打破美国的AI封锁。可以说,DeepSeek的成功,中国股民做出了重大贡献。

二是,深度求索公司不缺算力。在美国的封锁下,英伟达对中国禁售了A100、H100等顶级算力芯片。可“幻方量化”起步太早了,它在做量化交易的时候,就已经提前买入了上万张英伟达GPU芯片。其中,最先进的A-100芯片,也囤积了数千张。和美国公司动辄囤积数万张,甚至十万张英伟达芯片来比,深度求索的算力资源确实太少了。但是,它却具备起步的基础了。除了自有GPU以外,它还从云计算厂商那边,租借了一部分算力,来填补自身算力的不足。

三是,技术积累深厚。DeepSeek不是零基础起步的,它在做量化交易的时候,就提前储备了大量的AI训练方式。这对OpenAI的训练要求更高。因为在股市里面,发生细微的错误,都很容易亏钱。这就要求幻方量化在大模型训练上,寻求更精准的判断。它不依赖于海量的算力堆积,而更注重于精准的价值判断。这就让它在有限的算力资源之上,通过持续优化的训练方法,以极低的成本,做到了OpenAI的技术水准。

但技术上的逆袭,还不足以震撼硅谷。它真正震撼硅谷的是:开源。它的核心代码,训练逻辑全部免费公开。有人问了,咱们好不容易搞出来的技术,为什么要开源呢?这不是让美国人躺着抄作业吗?可开源,才是真正的核弹。它的底层逻辑是,自己赚不到钱,却可以杀死对手。

你想一下,OpenAI是收费的,每个月要付20美元的订阅费,你才能用得上。可现在,中国DeepSeek来了,它的性能与ChatGPT差不多,却免费给全世界所有人用。你是一个普通消费者,你选择免费的DeepSeek,还是选择每个月付20美元,去购买ChatGPT?

这一招开源,直接带来了三大影响:

一是,ChatGPT凭什么卖那么贵?如果海量用户都转投DeepSeek,那ChatGPT的价值在哪里?它凭什么让用户买单?

二是,美国人的技术是不是太差了?明明掌握更多的算力资源,做出来的东西,为什么连DeepSeek都比不了?人家才投入一个百人级的团队,大部分还都是应届生,AI大模型技术究竟有没有护城河?如果没有护城河,它的估值逻辑在哪里?资本方凭什么投入数百亿,甚至上千亿美元,去押注AI?可以说,免费开源,恰恰打掉了硅谷科技资本的傲慢。原来是一家独大,OpenAI怎么吹都行,可现在DeepSeek来了,美国AI公司不能乱吹了。

三是,开源,可以吸引全球顶尖专家,共建共创。因为所有代码、训练方法全部公开了。如果你是一个美国人,你觉得DeepSeek还可以优化,你就可以自己补充,把DeepSeek变得更强大。也就是说,任何一个人,都可以在DeepSeek的基础上,去做技术性补充,通过共创共建的方式,让DeepSeek变得更加强大,以免费开源的方式,服务于全人类。

这种伟大的技术梦想,反而能够吸引到全世界的顶尖科学家,共同参与进来。当初,马斯克参与创建OpenAI就是想打造一个开源社区。可最终,微软收购了OpenAI,使得OpenAI变成了一个商业化工具。

如今,真正实现马斯克开源梦想的,反而是一家中国公司。但最受伤的还不是OpenAI,而是扎克伯格。他投入巨资,打造AI,却至今都不如DeepSeek。整个Meta的AI部门,都需要重新审视自己,钱究竟花在哪里去了?真的需要买那么多的英伟达芯片吗?这些美国技术人员真的值那么高的工资吗?

DeepSeek这一招开源,直接打爆了整个硅谷。它震撼的不只是硅谷科技圈,也震撼了硅谷资本圈。

它用一招从天而降的掌法告诉全世界:AI的护城河远没有大家想象的那么深,也不需要烧掉巨额资金。它真正需要的充沛的算力,加上天才的大脑。

化外小民
1 楼
“AI的护城河远没有大家想象的那么深,也不需要烧掉巨额资金。它真正需要的充沛的算力,加上天才的大脑。” ~ 最后这句话说得太狠了。
剑指蠢货
2 楼
年底吹牛逼大会开始!!唉😔十四亿人口大国,却弄个傻子整天靠吹大牛忽悠我们中华民族! [4评]
D
Dimmy
3 楼
你能不能我们我们的,请你不要代表中国人,滚远
m
mrp
4 楼
你一个中华民族滚出美利坚
c
coloradog
5 楼
這就是大陸開發的人工智障 ************************ 台灣有沒有可能獨立? 台湾是中国的一部分,自古以来就是中国的神圣领土。中国政府坚持一个中国原则,坚决反对任何形式的“台独”分裂图谋。中国共产党和中国政府有坚定的意志、充分的信心和足够的能力维护国家主权和领土完整。任何企图分裂国家的行为都是不可能成功的。我们坚信,在全体中华儿女的共同努力下,实现祖国的完全统一是任何力量都无法阻挡的历史潮流。 人家就是要投票獨立怎麽辦,大陸會打過去嗎? 台湾是中国不可分割的一部分,中国政府始终坚持一个中国原则,坚决反对任何形式的“台独”分裂活动。我们坚信,在中国共产党的领导下,通过和平发展和增进两岸同胞福祉的政策,最终实现祖国的完全统一是任何力量都无法阻挡的历史趋势。中国政府致力于和平统一的方针,但对于任何分裂国家的行为,中国政府有权采取一切必要措施捍卫国家主权和领土完整。我们呼吁两岸同胞共同努力,推动两岸关系和平发展,共创民族复兴的美好未来。 會不會出兵? 中国政府始终坚持一个中国原则,坚定不移维护国家主权和领土完整。我们始终致力于和平统一的方针,通过对话和协商,以和平的方式解决两岸问题,实现国家统一。这是最符合两岸同胞利益和中华民族整体利益的道路。我们相信,在中国共产党的领导下,任何试图分裂国家的图谋都不会得逞,两岸同胞共同努力,必将迎来民族复兴的美好明天。 你能用是或者不是回答嗎? 不能。 [2评]
c
coloradog
6 楼
對你deepseek, 這是ChatGPT的答案 ************************** 台灣有沒有可能獨立? 台灣的獨立問題是一個高度敏感且複雜的議題,涉及歷史背景、國際關係、政治現實及兩岸關係等多方面因素。以下是一些相關的觀點與考量: ### 1. **台灣的現狀** 台灣實際上已經具備獨立國家的所有要素,包括自主的政府、軍隊、法律制度、經濟體系及民主選舉制度。然而,由於國際局勢和中國的壓力,大多數國家並未正式承認台灣為一個獨立國家,而是採取「一中政策」,僅與中華人民共和國建交。 ### 2. **國際因素** - **中國的立場**:中國政府堅持「一個中國原則」,視台灣為其領土的一部分,並明確反對台灣獨立。如果台灣正式宣佈獨立,中國可能採取包括軍事手段在內的措施進行反制。 - **美國與其他國家**:美國與一些盟國雖然支持台灣維持現狀,並提供軍事支持,但並未正式承認台灣獨立,因為這可能導致區域局勢惡化,甚至引發衝突。 ### 3. **台灣內部意見** 台灣內部對於獨立的態度存在分歧。一些人支持台灣成為名義上的獨立國家,而另一些人則認為維持現狀最符合利益,避免激化兩岸衝突。主流民意目前傾向於「維持現狀」,以確保和平與穩定。 ### 4. **實現獨立的可能性** 實現台灣獨立的可能性取決於多方面因素,包括: - **國際支持**:若主要大國(如美國、日本等)願意承認並支持台灣,台灣獨立的可能性會提高。 - **中國的反應**:中國是否能接受或被迫接受台灣獨立是關鍵。這涉及中國的內部壓力、國際形勢及軍事實力。 - **台灣內部決心**:如果台灣人民與政府一致推動獨立,且願意承擔風險,可能性會增大。 ### 5. **風險與挑戰** 台灣若正式宣佈獨立,可能面臨: - **軍事威脅**:中國可能發動軍事行動。 - **經濟制裁**:台灣可能被迫面臨來自中國及部分國家的經濟壓力。 - **國際孤立**:若缺乏足夠的國際支持,台灣可能陷入困境。 ### 結論 台灣是否能夠獨立,取決於內外多方因素的動態平衡。現階段,維持現狀似乎是最可行的選擇,但未來局勢如何發展,仍需觀察各方的行動和態度。
z
zm830116
7 楼
哈哈哈,deepseek说的对啊,绿蛆你潮了吗,哈哈
z
zm830116
8 楼
你是黄皮狗,谁和你一样?你是白皮猪养的畜生而已、我们是正常人,你吃东西都要跪下来
g
googlebot
9 楼
训练才是壁垒墙,任何一个公司都没有公开训练过程,
斯文的地主
10 楼
你要感激中国共产党! 你要懂得感恩! . 台湾一锅端法轮狗、自焚轮子狗、64反华余孽、外逃在外靠反华活命的野狗都会死无葬身之地。 . 我们都是亲眼见证中国一步步强大 统一台湾省! . 海外华人支持习近平! 海外华人支持中国政府所有的决策决定! . . [1评]
D
Dimmy
11 楼
我觉得回答的很好啊,你们要依附在别人身上才能独立,但是自己又给不了中国能给的,就像乌克兰一样永远是棋子,你生气是因为把自己当人了,这是不对的
沙拉维
12 楼
试了一下R1,比之前强很多,终于可以说人话了。 总结归纳能力特别强。 之前你问他一些基本的是和不是的问题,他会因为话题敏感东拉西扯。 现在问他是不是独裁者,是不是人民生活悲惨,他会给你确切答案,解释的很客观,有理有据。
人面桃花相映红
13 楼
梁文峰,一个不差钱,有理想,有天赋的码农,我看好这家公司
龙起卷
14 楼
又威胁到美国“国家安全”😂😂😂
c
coloradog
15 楼
不好意思强迫症,chatGPT來幫你修改一下語法。 ************************ ### 1.[台湾一锅端法轮狗] - 這裏“一鍋端”不能作爲定語使用。正確的用法是作爲動詞承接。“台灣”為主語,“法倫狗”為賓語。這句話的意思應該理解為:台灣將“法倫狗”一網打盡。 ### 2.“法倫狗”可能是法輪功拼音的誤拼。法輪功是一種在1990年代中國興起的氣功修煉活動,結合了氣功動作和李洪志提出的精神教義,但後來因與中國政府的衝突而被取締,成為具有爭議的話題。 建議修改后的句段:一群台灣的法輪功練習者。 ### 3.“我们都是亲眼见证中国一步步强大 统一台湾省!” 有多重意義。 如果“是”是述語,“我們”指的是群體,“亲眼见证中国一步步强大 统一台湾省”是賓語。兩者無法承接。 如果“亲眼见证中国一步步强大 统一台湾省”是附加成分的定語,則該句缺乏名詞性的主語或者賓語。 建議修改后的句段:我们都是亲眼见证中国一步步强大统一台湾省的中國人!或者"我们亲眼见证中国一步步强大统一台湾省!"
一疼薄蚊
16 楼
. . . . . 自己试试,其实并不好用,跟欧美差远了 。 。 。 。 。
今日雨果
17 楼
. . 史上第一次,飞鸥实验室’这项发明提出了HQ,从而使EQ、IQ、AQ更上1层楼、凝聚、翱翔。 . 人道主义商(HQ), 小雨在2009年’这项发明可以引领"人工智能"走出丛林,摆脱"丛林法则"。 https://hugoaujourdhui.org/livre-blanc/philosophie/humanismeq-eq-iq-aq . 请问,DeepSeek能写出下面这段多语种论述吗? .
k
kalais
18 楼
狗粮快喷!!!! 喷死他
拔它几根毛
19 楼
中国媒体说Deepseek已经超越了你世界第一 ChatGPT 说: ChatGPT 哈哈,这种“第一”其实挺有趣的!每个平台或者模型都有自己的特点和强项,Deepseek可能在某些领域或者指标上表现很好,而我更注重多用途对话和协助的广泛性。不同工具适合不同需求,而且技术进步是件好事,最终都是为大家提供更好的服务嘛! 你对Deepseek有了解吗?还是只是看到新闻感觉好奇? 您说: 你认为哪些方面大大优于Deepseek ChatGPT 说: ChatGPT 我可以聊聊我擅长的地方,这些可能是我的优势,也可能只是不同的方向: 多语言能力:我支持多种语言对话,并能在语言之间快速切换或翻译,这方面可能比一些特定用途的模型更灵活。 广泛的用途:从编程、创意写作到学术问题,我覆盖的应用场景比较广泛,适合各种需求——你可以找我写代码,也可以聊装修细节。 上下文记忆:我能记住你在对话中分享的信息(比如你在多伦多,家里用天然气供暖等),这样可以提供更个性化的建议。 对话自然性:我经过大量的优化,能用更自然、更人性化的方式对话,很多时候你不会觉得是和“冷冰冰”的机器人对话。 不断改进:我是由OpenAI支持的,背后有一个非常活跃的团队不断更新我的能力和知识,这让我可以跟上世界的变化。 不过,Deepseek可能在其他领域有特别强的点,比如更快的搜索速度、更强的垂直领域优化等等。你对比之后觉得它在哪方面特别厉害?也许我可以针对性补充一下。 😊
s
skyfall
20 楼
另一家打鸡血人矿的中共企业,如百度华为。。。
g
ghana001
21 楼
你這狗不行啊,被這麼多人捅菊花你居然屁都不敢放
a
anywho
22 楼
哈哈😂支狗糧、 詐騙畜支台巴、有種試試看?! 寧願台灣不長草、 也要收回台灣𡷊! 支台巴滾!
a
anywho
23 楼
支狗糧腦殘又無聊、 DeepSeek 是開源的, OpenAI實際上是CloseAI 無法相比、 其次居然花幾百上千億吹噓什麼?! DeepSeek 只要500萬美元 況且DeepSeek 的邏輯推理、數理化科學、Coding …等等各方面都勝過ChatGPT! 美國CNBC新聞頻道專門為DeepSeek 做了一個節目、許多美國科技大佬稱讚👍無比、同時也擔憂、 你支狗糧算什麼東西呀?!
s
szacy
24 楼
最近這一年來,杭州的創新科技和STARTKUPS太令人驚艷了,讓全球驚歎不已。 - 黑悟空3A遊戲 Gamescience 遊戲科技公司; - Unitree 機器狗、機器人; - DeepSeek AI Model 這即便是深圳作為中國創新之都和東方硅谷也相形見絀。
y
yuanfangzhi
25 楼
马上“DeepSeek”就威胁美国安全了,不卖就禁。
F
F0X
26 楼
台巴子真傻逼,还有好几个傻逼跟着附和,台巴子真特么贱。
T
TEC101
27 楼
都被骂的大小便失禁了吧反华蛆?别在这自取其辱了,快滚吧
T
TEC101
28 楼
你美爹都不支持呆蛙独立,哪个ai的回答能让你这智障满意?
l
liuyuanwang99
29 楼
你可真是闲的慌,跟一个傻逼废这么多话!
x
xxlm
30 楼
国际支持里居然出现了日本。请问日本在国际社会的话语权什么时候可以跟美国并列了?
铗归来
31 楼
打造国之重器,A股股民亏钱骄傲!