中国学霸打崩美国AI巨头心态!DeepSeek老板是他

今日头条
Toutiao
最新回复:2025年1月27日 17点0分 PT
  返回列表
87804 阅读
74 评论
北美留学生观察

2025年的开年,总理主持的新年首场专家、企业家座谈会,一位年轻人的出席让人眼前一亮。他就是85后创业者梁文锋,深度求索(DeepSeek)和幻方量化的创始人。他不仅是量化投资领域的“王者”,更是人工智能领域的先锋。他领导的团队仅用2048张GPU,在53天内打造出全球领先的大模型“DeepSeek-V3”,用极低成本完成了对美国OpenAI的技术“逆袭”。

在座谈会上,梁文锋提出了关于国产大模型发展的独到见解。他低调却充满力量的形象,成为中国科技力量崛起的缩影。从一位普通的湛江少年,到震撼硅谷的AI创新者,他的故事,是一段关于技术、勇气和坚持的传奇。

01 少年成才:从湛江到浙江大学

1985年,梁文锋出生在广东湛江的一个普通家庭。湛江当时是一个经济发展缓慢的三线城市,他的父亲是一名小学老师,家庭并不富裕,但却给了梁文锋充满智慧和坚韧的成长环境。自幼,梁文锋便展现出对数学和科学的天赋,他对数字与逻辑的敏感性远超同龄人,这也让他成为老师和同学眼中的“学霸”。

最后一排右边第6个是梁文锋。

2002年,17岁的梁文锋以优异成绩考入浙江大学电子信息工程专业,成为家族中第一个进入顶尖高校的孩子。在当时,浙大是一所注重理工科发展的高校,而电子信息工程又是其中的王牌学科。对梁文锋来说,这是一个开拓视野的全新舞台。在浙大的四年本科生活里,他不仅刻苦学习,还积极参加各种数学建模竞赛,逐渐在学术圈小有名气。

梁文锋的求学历程

本科毕业后,他并没有选择直接就业,而是继续在浙江大学攻读硕士,研究方向从电子信息转向了更具前沿性的机器视觉。他的导师项志宇教授是国内这一领域的专家,这段时期让梁文锋的学术能力得到了极大的提升,也让他进一步接触到了人工智能领域的技术发展。

然而,与许多追求“高薪体面”工作的同学不同,梁文锋的目标从来不局限于做一名普通工程师。他在学术研究之余,开始关注更大的产业变革方向,尤其是人工智能在实际场景中的应用。他坚信,科技将成为未来社会的核心驱动力,而自己必须抓住这场时代机遇。

正是这份“走在别人前面”的勇气与决心,让梁文锋在大学期间便踏上了一条充满挑战的路。他带领一群志同道合的伙伴,尝试用机器学习的方法分析金融市场数据,甚至在全球金融危机的阴影下,探索全自动量化交易的可能性。这些“超前”的尝试,逐渐成为梁文锋未来事业的基石,也奠定了他走向世界科技舞台的起点。

此图来自幻方官网

02 量化投资的崛起:从“幻方”开始书写传奇

2008年,全球金融危机爆发,这对传统金融市场带来了深远影响,却也让技术驱动的量化交易迎来了发展的契机。当时,尚在浙大读研究生的梁文锋敏锐地察觉到,技术和数据可以重塑金融市场。他带领一群志同道合的同学,用机器学习方法分析市场数据,尝试实现全自动量化交易。他们采集海量的市场行情数据、宏观经济信息,并用数学建模的方法研究价格波动规律。这些探索不仅为梁文锋积累了实践经验,也为他日后的创业埋下了伏笔。

2013年,梁文锋与浙大校友徐进共同创办了杭州雅克比投资管理有限公司,正式迈入量化投资的世界。尽管当时的量化投资在国内还处于起步阶段,但梁文锋凭借对技术的信仰和对市场的深刻理解,坚定地相信这是金融领域的未来。

2015年,中国量化投资行业迎来了重要节点——中证500股指期货的上市。这为量化私募提供了更丰富的对冲工具,也标志着行业进入2.0时代。同年,30岁的梁文锋与徐进正式创办幻方量化(High-Flyer),用技术重新定义投资策略。他们的愿景是通过数学建模和人工智能,成为世界顶级量化对冲基金。

初创阶段的幻方量化,仅凭10张GPU显卡完成了多项产品的设计和发布。在2015年的“股灾”中,梁文锋的高频量化策略帮助团队取得了不错的成绩,吸引了大量资金和客户的关注。短短一年内,幻方量化成立了20只产品,快速扩张资金管理规模。这种依靠技术驱动的高效率运作模式,使幻方迅速成为量化投资领域的佼佼者。

2016年,梁文锋带领团队推出了第一个由深度学习算法驱动的AI模型,并开始将GPU引入计算交易仓位。这在国内量化领域尚属首创。当年年底,幻方量化的管理规模突破10亿元。随后几年,梁文锋不断扩大AI算法研究团队,将人工智能技术深度融入量化策略,逐步取代传统模型。

2018年,幻方量化首次获得了中国私募证券领域的最高奖项——私募金牛奖,这标志着它在行业内的领先地位。与此同时,团队也开始遇到算力瓶颈。梁文锋再次展现了他对技术的执着,投入巨资研发“萤火一号”深度学习平台,为幻方量化提供大规模算力支持。

2019年,幻方量化的管理规模突破百亿元,正式跻身国内顶级量化私募行列。2021年8月,幻方量化的资金管理规模一度突破千亿,成为行业内的“量化四大天王”之一。这一年,梁文锋在金牛奖颁奖典礼上发表演讲,指出“量化投资的未来,是用技术让市场更有效率”。

梁文锋在金牛奖颁奖典礼现场

然而,辉煌的背后也伴随着挑战。2021年底,由于市场波动和技术决策问题,幻方的业绩出现回撤,团队决定主动缩减管理规模并暂停新产品募集。这一决定虽然短期内带来了质疑,却体现了梁文锋对风险控制的高度敏感。

2021年,梁文锋还带领幻方先于一些云厂商拿到英伟达A100显卡,并且其AI集群搭载显卡的数量达到“万卡级别”。有报道称,当时国内超过1万枚GPU的企业不超过5家,而且除了幻方之外,其他4家公司都是互联网大厂。

英伟达创始人黄仁勋介绍显卡产品

尽管幻方量化的规模有所收缩,但梁文锋的技术信仰从未动摇。他通过量化投资的实践,证明了科技在金融领域的深远价值。而幻方的成功,也为他积累了足够的资本和资源,支持他在人工智能领域开启新的征程。

03 跨界AI:DeepSeek的横空出世

2023年,38岁的梁文锋再次选择站在技术浪潮的最前沿。这一次,他瞄准的是更具前景和挑战的人工智能领域。他创办了深度求索(DeepSeek),这是一家专注于AI大模型研发的公司,目标是用低成本、高性能的技术,打破国际巨头在人工智能领域的垄断。

梁文锋对人工智能并不陌生。在幻方量化的崛起过程中,人工智能早已成为量化策略的核心驱动力。而这次,他决定跳出金融行业,把自己对技术的热情倾注到人工智能的大模型研发中。他的思路十分明确——通过技术创新和成本优化,让AI技术更加普惠。他直言:“我们不是要跟随,而是要在技术上真正超越。”

2024年:DeepSeek的爆发之年。在成立仅一年后,DeepSeek就凭借其创新能力,成为AI领域一颗耀眼的新星。2024年5月,DeepSeek发布了其首款混合专家语言模型DeepSeek-V2。这一模型以超低的价格震惊市场:每百万tokens输入1元、输出2元,仅为GPT-4 Turbo价格的百分之一。凭借出色的性能和性价比,DeepSeek-V2引发了一场大模型价格战,国内外科技巨头纷纷跟进降价。

然而,DeepSeek的真正爆发点出现在2024年12月。梁文锋带领团队推出了新一代大模型DeepSeek-V3。这款模型不仅在数学运算、代码生成和中文问答等方面表现出色,更令人震惊的是,它的训练成本仅为557.6万美元,而OpenAI的GPT-4o训练成本高达7800万美元。DeepSeek-V3以1/10的成本实现了对GPT-4o的全面对标,被美国科技圈称为“来自东方的神秘力量”。

DeepSeek-V3的各项测试结果与同行对比

DeepSeek的成功并非偶然,而是梁文锋在团队管理和技术研发上的一系列独特策略的结果。他组建了一支完全由本土年轻程序员组成的团队,不依赖海归或高级技术专家。团队成员大多是应届毕业生或工作经验不超过5年的年轻人。梁文锋认为,“创新需要摆脱惯性,经验有时会成为包袱。”

此外,DeepSeek采取了开源的技术策略,主动向全球开发者社区分享核心技术成果。这种开放的态度不仅赢得了国际认可,也推动了行业技术生态的快速发展。OpenAI的创始成员安德烈·卡帕西(Andrej Karpathy)评价说:“DeepSeek在有限资源下展现了惊人的工程能力,它可能重新定义大模型研发的规则。”

DeepSeek的技术突破让美国硅谷震撼不已,多位业内人士称,DeepSeek-V3的问世打破了全球AI巨头的“成本壁垒”。有评论认为,DeepSeek在降低算力需求、优化训练效率上的创新,可能会彻底改变AI行业的生态。

然而,梁文锋并未急于将DeepSeek商业化。他坚信,人工智能领域的成功取决于长期的技术积累,而非短期的盈利目标。他表示,DeepSeek的使命是“以更低的成本、更高效的技术推动人工智能的普及”,并始终把技术研发置于首位。

04 技术驱动未来:中国科技的崛起力量

梁文锋始终站在技术创新的最前沿。从量化投资到人工智能,他不断用实践证明,中国科技不仅能参与全球竞争,更能引领技术变革。他认为,中国科技企业不能永远跟随,而是要勇敢站到前沿。

深度求索的成功,证明了他的远见和坚持。在全球AI竞争愈发激烈的今天,梁文锋用技术和创新,让中国AI力量在国际舞台上赢得了一席之地。正如他所说:“我们不只是追赶,更要在核心技术上实现真正的超越。”

梁文锋,这位85后中国小伙,正用他的低调和实力,为中国科技书写更多震撼全球的故事。

b
bk59
1 楼
可以把中国扩充到华人汉人,美国的AI界也大量华人
E
Ewq123ewq
2 楼
黄俄贼靠二道贩子的走私芯片,打崩了巨头?
今日雨果
3 楼
Part 3 of 3 📍Contact VUL for ideas and invention patents: 🌴🌳🌲 https://HugoAujourdhui.org/ ☞ 🕯️ ☞ ❗️ 🌿 Le communicateur imaginé par Steve Jobs en 1983 existe déjà en réalité dans VUL - "Communicateur de PetitPluie-Chaîne" ☞ 🍃 🍃 🍃 2024-11-06 🌿The communicator Steve Jobs imaging in 1983 actually is already existing in VUL - Victor Universel Labo - "Little-Rain-Chain Communicator"|"小雨链通讯器" ☞ 🍃 🍃 🍃 . Victor Universel Labo - VUL - 飞鸥实验室 V1.000.2025-01-21, 1989-06-04. Nice, Côte d'Azur、Paris, France . . [1评]
匿名2018
4 楼
奔着做空美股去的吧
D
Dimmy
5 楼
干你妈 叫你复制粘贴 你妈被车撞死
c
crunchtime
6 楼
无骨舔腚拴脖牲畜金三诚聘腿毛贵军青蛙,如丧考妣,发出阵阵哀嚎。
o
oligarch
7 楼
问题是真的像你们吹的那样就应该反应在股价上了,美国ai概念股没有什么波动啊
f
football0105
8 楼
本来韭菜就不该去炒股,正好把韭菜赶出股市,让大机构之间互相斗!
D
Dinotrux
9 楼
牛逼
D
Dinotrux
10 楼
人家是开源,你好歹研究一下再喷
只想一个人
11 楼
真的是那么厉害吗
活在裆下
12 楼
虽不是套壳但也大差不差,说是600w美元做出来的,但他用的是chatgpt的数据训练出来的,没有别人投入的几千亿美元训练出的数据也就没有deepseek
C
Cromwellgm
13 楼
真不知道,怎么说才好,所有评价deepseek的读者,认知它是否好,来源于1)新闻 2)自己和它的 Chat ==> 我的测试:下载GitHub 一个demo project 和 测试 Plan ==> 交给DeepSeek ==> 要知道结果怎样,自己去试一下吧……愚蠢的读者:AI 不是人工智能《小红书》!!!
北京男人A
14 楼
英伟达,台积电崩盘,台蛙绿蛆哀鸿遍野。
脑子常进水
15 楼
人家一开源,咱们就遥遥领先了!
g
ghana001
16 楼
台狗們,別陰陽怪氣,也別講得輕巧 有本事你們做個讓美國主人下載前十的APP出來 就恐怕你們只懂吠
c
cromwellgm
17 楼
哎,中国媒体在这么欺骗中国韭菜,有意思吗? )一个浙大毕业的毛头小伙,一个初创的小公司:在AI井喷之前,居然高瞻远瞩,以排江倒海的魄力:购买了上万片的天价的GPU。 *)这个毛头小伙真是神人吗?有那么厉害的远见? *)这个一个初创的小公司,难道有那么厉害的融资能力?哪家风投有那么厉害的胆量,这么多亿的钱投给这个《毛头小伙初创的小公司》? 。。。。。 事出非常,必有妖!背后是《中国国家级机构的AI战略部署》的安排吧!
e
edgelife
18 楼
现在才公布,严重怀疑老共有意而为,老共有高人,牛
H
HL16888
19 楼
DeepSeek非常优秀一点不错,但就此得出不需要Nvidia的结论是有逻辑错误的,DeepSeek的成功更加说明了AGI的光明未来。DeepSeek给别的公司提供了一个好的思路,可以加快AGI的发展,而不是说就不需要那么多的GPU了,算力永远是多多益善的。股市的第一反应往往是过度的,不理智的。不过这件事说明美国对中国的封堵是失败和愚蠢的,其结果就是把美国公司的优势地位拱手让给了中国公司
a
anywho
20 楼
一個中國DeepSeek, 打穿Al泡泡🫧! 了不起!
s
shankecn
21 楼
你看看小扎最新说的话:为了应对中国这个百十人的公司,meta需要美国政府的支持。
r
roadshark
22 楼
事实会说话。 . A shocking Chinese AI advancement called DeepSeek is sending US stocks plunging ---CNN . US stocks dropped sharply Monday morning after a surprise advancement from a Chinese artificial intelligence company, DeepSeek, threatened the aura of invincibility surrounding America's technology industry.
q
qwerty
23 楼
此人要小心,卸磨杀驴,网贷,境外敌对势力,个个都是索命栓
狗狗的主人
24 楼
美国现在是要玩命骗人买铲子, 而推高铲子的价格 , 其实那些东西需不需那么多铲子挖呢 ? 这才是重点
f
fivecentsdog
25 楼
来来来,老子给你们这些傻逼科普一下 美国搞了环球资源,中国抄袭搞了阿里巴巴 美国搞了搜索引擎谷歌,中国搞个百度 美国搞个谷歌地图,中国搞了百度地图 美国兴起电动车,中国也跟着 美国搞了优步打车,中国抄袭搞嘀嘀打车 美国搞ChatGPT 中国抄袭搞个deepseek 看明白了狗逼们? 抄袭的是人家的概念! 技术不怕你抄袭,但创新概念你是抄袭不去的! 要老子说,中国最牛逼的创意其实是团购! 其他的就别丢人现眼了 [5评]
狗狗的主人
26 楼
美国负责做PPT, 中国负责给美国实现,多好,双赢😂🤣😂🤣😂🤣😂🤣😂🤣😂🤣😂🤣🤣
大地阳光
27 楼
你觉得美国纳指为什么今天大跌呢? 特别是NVIDIA
大地阳光
28 楼
你觉得美国纳指为什么今天大跌呢? 特别是NVIDIA
大地阳光
29 楼
你觉得美国纳指为什么今天大跌呢? 特别是NVIDIA
大地阳光
30 楼
你觉得美国纳指为什么今天大跌呢? 特别是NVIDIA。 你去跟你的米国主子说一说。
大地阳光
31 楼
你觉得美国纳指为什么今天大跌呢? 特别是NVIDIA。 你去跟你的米国主子说一说。
爸他志洪李
32 楼
兄弟你重仓NVIDIA啦?
a
ak47a
33 楼
最值得骄傲的,不但是梁文锋及团队,取得了重大成功/。更可喜的还有中国自已的高校,也能够陪养出这种超一流的科技人才。
s
skyfall
34 楼
独裁国家一丘之貉都爱吹牛逼。
j
jxxy1234
35 楼
nvda stock的价格是看好未来ai算力的强大需求才被推高的。 如果训练成本真的被降低到3%,甚至不用3%,降低50%,那也意味着同等训练下nvida的销售额会打五折。 在考虑到美国在AI算力上对中国的限制,而中国又有自己的算力卡, 这后续真的很难说
j
jxxy1234
36 楼
人吃肉,你这“五分狗杂种”不愿意跟人学,所以决定吃屎。 你这自我认知倒是挺准确的
无视生非
37 楼
这个逼智商不在线啊哈哈哈🤣
d
daniel1
38 楼
如果真的能做到AI超越美国,那么美国真的要和中国开战,那么中国一直想和美国抗衡机会来了,可惜军力差距太大,最终中国倒了 [1评]
s
shankecn
39 楼
进攻端至少5倍以上的优势兵力才能取胜。况且美国兵力这么分散,为了打这场仗,美国需要放弃全球所有的利益除了亚太。
今日雨果
40 楼
. 事实上,谷歌搜索引擎,比小雨开发的“知识搜索引擎”晚了20+年❗️ . 🌴🌳🌲 https://HugoAujourdhui.org/ ☞ 🕯️ ☞ 🤔😊 🌿Ce bébé du moteur de recherche est né N ans plus tôt (N = 20+) que le moteur de recherche Google Re: les meilleurs produits, ils ont presque toujours été conçus pour le bénéfice des personnes qui les construisent réellement ☞ 🍃 🍃 🍃 2024-12-18 🌿This Search engine baby was born N years earlier (N = 20+) than Google search engine was born Re: greatest products, they've almost always been designed for the benefit of the people who are actually building them ☞ 🍃 🍃 🍃 . . 回答: 来来来,老子给你们这些傻逼科普一下 美国搞了环球资源,中国抄袭搞了阿里巴巴 美国搞了搜索引擎谷歌,中国搞个百度 美国搞个谷歌地图,中国搞了百度地图 美国兴起电动车,中国也跟着 美国搞了优步打车,中国抄袭搞嘀嘀打车 美国搞ChatGPT 中国抄袭搞个deepseek 看明白了狗逼们? 抄袭的是人家的概念! 技术不怕你抄袭,但创新概念你是抄袭不去的! 要老子说,中国最牛逼的创意其实是团购! 其他的就别丢人现眼了 。 。
轻抚菊花不语
41 楼
開源的東西,你可以直接看源代碼.怎麽套殼.有套殼早被不知道多少程序猿揪出來了.
专骂独轮运
42 楼
因为人家早在十年前就用AI来炒股并且赚了几十忆了,现在只不过看到Open AI在那里吹牛,实在看不下去了,就兼职弄个Deep Seek来打脸了。 [1评]
t
tiger500
43 楼
按照傻瓜的逻辑50多天是弄不出个软件。没毛病。
b
bigsloth
44 楼
那水平确实是在那,那就顺手也逆袭一下H100 外加EUV。
t
tiger500
45 楼
你这只五分狗要给傻逼科普一下?
搞啥都好
46 楼
上周的数据,股市机构没有进场,散户是主导,标普新高,纳指高位。现在猜猜今天为什么英伟达大跌,而不停失去市场的苹果却在上涨? [1评]
t
tiger500
47 楼
送 52 楼: 气死你这只意识形态狗粮!
老童生
48 楼
和沪深股市相比,他的这个模型更适用于美股市场
t
tiger500
49 楼
洋人吃惊,狗粮气炸! [1评]
b
baochaodaiwa
50 楼
股市蛙绿蛙绿的,台巴子倭杂狗畜遍地哀号
b
bigsloth
51 楼
原装的写法不是:吃精?
大地阳光
52 楼
https://www.6parknews.com/newspark/view.php?app=news&act=view&nid=707654 《DeepSeek冲击全球:日本半导体股下挫,纳指期货大跌(图)》 -------- 狗粮继续洗呀。
O
OCDXDD
53 楼
He always does that
媚眼瞟瞟
54 楼
: 你不要自欺欺人了。 除非是不值钱的程序, 绝大部分程序都是有两层的。 外面一层公开, 就是所谓的开源。 里面一层是保密的。 手脚就在这一层里面。 而这一层, 反正你读不了, 可以以欺骗的形式给你塞些垃圾进去。 你想用这些代码自己产生软件吗? 做你的美梦去吧。 开源程序99%都是只能看不能用的。 [1评]
瓜果梨桃
55 楼
deepseek R1完全开源了。 绝大部分程序都是有两层的??? 你就是在胡扯。
七素八荤
56 楼
我越来越相信,西方过去一直是剽窃中国的科技。 光的确是从中国来。 可见汉奸卖国狗自古就有。 西方骗子以宗教身份,一直在偷