陆媒:中国AI的进步之快让美国人怀疑现实了

钛媒体

3 个月前

文｜阑夕

这几天刷推很明显的感觉到英文技术社区对中国AI产业的进步速度处于一种半震动半懵逼的状态，应激来源主要是两个，一个是宇树（Unitree）的轮足式机器狗B2-W，另一个是开源MoE模型DeepSeek-V3。

宇树在早年基本上属于是波士顿动力的跟班，产品形态完全照猫画虎，商业上瞄准的也是低配平替生态位，没有太大的吸引力，但从B系列型号开始，宇树的机器狗就在灵活性上可以和波士顿动力平起平坐了。

B2-W的意外在于切换了技术线，用运动性更高但平衡性同时也更难的动轮方案取代了B2还在沿用四足方案，然后在一年时间里完成了能在户外环境里跋山涉水的训练，很多美国人在视频底下说这一定是CGI的画面，不知道是真串还是心态炸了。

波士顿在机器狗身上也曾短暂用过动轮方案，或者说它测过的方案远比宇树要多——公司成立时长摆在那里——但是作为行业先驱，它连保持一家美国公司的实体都办不到了。

现代汽车2020年以打折价从软银手里买了波士顿动力，正值软银账面巨亏需要回血，而软银当初又是在2017年从Google那里买到手的，Google为什么卖呢，因为觉得太烧钱了，亏不起。

这理由就很离谱，美国的风险资本系统对于亏损的容忍度本来就是全球最高的，没有之一，对于前沿性的研究，砸钱画饼是再寻常不过了的——看这两年硅谷在AI上的投入产出比就知道了——但波士顿动力何以在独一档的地位上被当成不良资产卖来卖去？

那头房间里的大象，美国的科技行业普遍都装作看不到：美国人，如今的美国人，从投行到企业，从CEO到程序员，从纽约到湾区，对制造业的厌弃已经成为本能了。

A16Z的合伙人马克·安德森2011年在「华尔街日报」写了那篇流传甚广的代表作「软件吞噬世界」，大概意思是，边际成本极低的软件公司注定接管一切水草繁盛之地，和这种可以提供指数级增长的生意比起来，其他的行业都不够看。

并不是说马克·安德森的表达有问题，后面这十几年来的现实走向，也确实在证明这条攫取规模化利润的回报是最高的，但美国人的路径依赖到最后必然带来一整代人丧失制造能力的结果。

这里说的丧失制造能力，并不是说丧失制造兴趣或是热情，我前段时间拜访了深圳一家逆向海淘公司，业务就是把华强北的电子配件做成可索引的结构化目录，然后提供从采购到验货再到发包的全流程服务，最大的买方就是美国的DIY市场和高校学生，他们之所以要不远万里的等上几个星期委托中国人来买东西，就是因为在诺大的美国本土，根本找不到供应链。

然后那些学生也只有在读书时才有真正尝试制造某些东西的机会，到了要去大公司里上班领薪后，再也没人愿意把手弄脏了。

但软件终究不能脱离硬件运行，哪怕硬件生产的附加值再不够看，基于采集一手物理数据的入口，制造商腰板硬起来后去做全套解决方案，只取决于能不能组建好的工程师团队，反过来却不一样，制造订单长期外包出去，它就变成产业链配套回不来了。

所以像是多旋翼无人机和四足机器狗这类新兴科技萌芽的原型机一般都还是产自有着试错资本的欧美，也就是所谓「从零到一」的过程，而在「从一到十」的落地阶段，中国的追赶成果就会开始密集呈现，进入「从十到百」的量产之后，中国的供应链成本直接杀死比赛。

波士顿动力的机器人最早在网上爆火的时候，Google X的负责人在内部备忘录里说他已经和媒体沟通了，希望不要让视频和Google扯上太大关系，是不是很迷惑，这么牛逼的事情，你作为母公司非但不高兴，还想躲起来，现在你们懂得这种顾虑从何而来了，就是觉得贵为软件巨头的Google去卷袖子干制造的活儿太卑贱了呗。

当然美国也还有马斯克这样的建设者（Builder），但你要知道马斯克的故事之所以动人，是因为他这样的人现在是极度稀缺的，而且长期以来不受主流科技业界待见，完全是靠逆常识的成就——造汽车，造火箭，造隧道，这都是硅谷唯恐避之不及的事情——去一步步打脸打出来的名声。

如果说宇树是在硬件上引起了一波怀疑现实的热度，那么DeepSeek则在软件的原生地盘，把大模型厂商都给硬控住了。

在微软、Meta、Google都在奔着10万卡集群去做大模型训练时，DeepSeek在2000个GPU上，花了不到600万美金和2个月的时间，就实现了对齐GPT-4o和Claude 3.5 Sonnet的测试结果。

DeepSeek-V2在半年前就火过一波，但那会儿的叙事还相对符合旧版本的预期：中国AI公司推出了低成本的开源模型，想要成为行业里的价格屠夫，中国人就擅长做这种便宜耐用的东西，只要不去和顶级产品比较，能用是肯定的。

但V3则完全不同了，它把成本降了10倍以上，同时质量却能比肩t1阵营，关键还是开源的，相关推文的评论区全是「中国人咋做到的？」

虽然但是，后发的大模型可以通过知识蒸馏等手段实现性价比更高的训练——类似你学习牛顿三定律的速度降低的斜率也在有利于追赶者，肯定比牛顿本人琢磨出定律的速度要快——成本，但匪夷所思的效率提升，是很难用已知训练方法来归纳的，它一定是是在底层架构上做了不同于其他巨头的创新。

另一个角度更有意思，如果针对中国的AI芯片禁售政策最后产生的后果，是让中国的大模型公司不得不在算力受限的约束下实现了效率更高的解决方案，这种适得其反的剧情就太讽刺了。

DeepSeek的创始人梁文锋之前也说过，公司差的从来都不是钱，而是高端芯片被禁运。

所以中国的大模型公司，像是字节和阿里这样的大厂，卡能管够，把年收入的1/10拿出来卷AI，问题不大，但初创公司没这么多弹药，保持不下牌桌的唯一方法就是玩命创新。

李开复今年也一直在表达一个观点，中国做AI的优势从来不是在不设预算上限的情况下去做突破性研究，而是在好、快、便宜和可靠性之间找出最优解。

零一和DeepSeek用的都是MoE（混合专家）模式，相当于是在事先准备的高质量数据集上去做特定训练，不能说在跑分上完全没有水分，但市场并不关心原理，只要质价比够看，就一定会有竞争力。

当然DeepSeek不太一样的是，它不太缺卡，2021年就囤了1万张英伟达A100，那会儿ChatGPT还没影呢，和Meta为了元宇宙囤卡却阴差阳错的赶上AI浪潮很像，DeepSeek买那么多卡，是为了做量化交易⋯⋯

我最早对梁文锋有印象，是「西蒙斯传」里有他写的序，西蒙斯是文艺复兴科技公司的创始人，用算法模型去做自动化投资的开创者，梁文锋当时管着600亿人民币的量化私募，写序属于顺理成章的给行业祖师爷致敬。

交待这个背景，是想说，梁文锋的几家公司，从量化交易做到大模型开发，并不是一个金融转为科技的过程，而是数学技能在两个应用场景之间的切换，投资的目的是预测市场，大模型的原理也是预测Token。

后来看过几次梁文锋的采访，对他的印象很好，非常清醒和聪明的一个人，我贴几段你们感受一下：

「暗涌」：大部分中国公司都选择既要模型又要应用，为什么DeepSeek目前选择只做研究探索？

梁文锋：因为我们觉得现在最重要的是参与到全球创新的浪潮里去。过去很多年，中国公司习惯了别人做技术创新，我们拿过来做应用变现，但这并非是一种理所当然。这一波浪潮里，我们的出发点，就不是趁机赚一笔，而是走到技术的前沿，去推动整个生态发展。

「暗涌」：互联网和移动互联网时代留给大部分人的惯性认知是，美国擅长搞技术创新，中国更擅长做应用。

梁文锋：我们认为随着经济发展，中国也要逐步成为贡献者，而不是一直搭便车。过去三十多年IT浪潮里，我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降，躺在家里18个月就会出来更好的硬件和软件。Scaling Law也在被如此对待。但其实，这是西方主导的技术社区一代代孜孜不倦创造出来的，只因为之前我们没有参与这个过程，以至于忽视了它的存在。

「暗涌」：但这种选择放在中国语境里，也过于奢侈。大模型是一个重投入游戏，不是所有公司都有资本只去研究创新，而不是先考虑商业化。

梁文锋：创新的成本肯定不低，过去那种拿来主义的惯性也和过去的国情有关。但现在，你看无论中国的经济体量，还是字节、腾讯这些大厂的利润，放在全球都不低。我们创新缺的肯定不是资本，而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。

「暗涌」：但做大模型，单纯的技术领先也很难形成绝对优势，你们赌的那个更大的东西是什么？

梁文锋：我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距，但真实的gap是原创和模仿之差。如果这个不改变，中国永远只能是追随者，所以有些探索也是逃不掉的。英伟达的领先，不只是一个公司的努力，而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势，手里有路线图。中国AI的发展，同样需要这样的生态。很多国产芯片发展不起来，也是因为缺乏配套的技术社区，只有第二手消息，所以中国必然需要有人站到技术的前沿。

「暗涌」：很多大模型公司都执着地去海外挖人，很多人觉得这个领域前50名的顶尖人才可能都不在中国的公司，你们的人都来自哪里？

梁文锋：V2模型没有海外回来的人，都是本土的。前50名顶尖人才可能不在中国，但也许我们能自己打造这样的人。

「暗涌」：所以你对这件事也是乐观的？

梁文锋：我是八十年代在广东一个五线城市长大的。我的父亲是小学老师，九十年代，广东赚钱机会很多，当时有不少家长到我家里来，基本就是家长觉得读书没用。但现在回去看，观念都变了。因为钱不好赚了，连开出租车的机会可能都没了。一代人的时间就变了。以后硬核创新会越来越多。现在可能还不容易被理解，是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就，群体性想法就会改变。我们只是还需要一堆事实和一个过程。

⋯⋯

targer

3 个月

1 楼

自吹自擂，让五毛狗撸吊打飞机。 [1评]

wmqjsgg

3 个月

2 楼

小学生思想算进步傻逼 [1评]

无

无伤93

3 个月

3 楼

狗子有什么。。。有白鬼祖宗哈哈哈哈

吹

吹牛大大大国

3 个月

4 楼

又平起平坐了不是已经超越了吗 [1评]

纵

纵横捭阖

3 个月

5 楼

这两天中国又开始集中吹牛逼了！！呵呵！看来死猪不怕开水烫，到死了都要吹，不吹得血糊淋漓不痛快！ [1评]

一

一婊淫才

3 个月

6 楼

马老板开源当天晚上就一批自主研发姿势产权的AI上线了。你说厉不厉害？宇宙第一厉害！

Griller

3 个月

7 楼

你作为劣质文明里，一个被劣化洗脑到浑身流脓的群体；是用你没受过教育带来的劣化，来碰瓷一个优雅文明的群体的么？

Griller

3 个月

8 楼

你如果能拥抱文明，或许能改变你经历的劣化，让你的社会也变好。

大

大师画拾苟奴

3 个月

9 楼

其实中国人对自己的东西很少有满意的，所以总在改进着。狗粮们都知道这些东西是多么的不堪全靠吹，关键是豢养狗粮的那些狗粮主子犯糊涂，心里总对此打颤。哪个狗粮有本事去做做狗粮爹的思想工作，让豢养狗粮的别对此忧心忡忡，而是放心躺平了睡。狗粮们真尼玛无用，都不知道为主子分忧。哈哈哈

Griller

3 个月

10 楼

中国主要是文化和文明超过伪善文化。科技掌握在文明手里论述的一方面，另一方面是，文明也会促进科技的发展。你如果追求自由和平等，你也是会拥抱文明的。

Griller

3 个月

11 楼

伪善文化是会劣化人性到傲慢，愚昧，猥琐和懦弱的。这里很多人本质并不坏，只是劣质文化的受害者，被洗脑到人性的悲剧而已。

Washington001

3 个月

12 楼

看到好多很沮丧的狗子。这个AI模型才是将来发展的方向：高效、低成本。OpenAI到现在严重亏损。有人说过，目前的AI发展和过去Google、Meta之类的公司的发展模式完全不一样。Google这样的公司在初期投资很大，但后期虽然用户大增，但需要的成本增加不多，利润率会很快增加。但目前的AI公司的运营成本和用户增加的相关性很大。初期投入和后期投入都很高。如果中国公司能将成本打下来，那竞争力就很强了。美国公司有大量的钱和可买到的资源，现在都是不计成本在搞。马斯克一下就装了10万块英伟达的芯片，仅芯片成本就是好几十亿美元。这样是玩不下去的。不仅芯片和设施成本，那个供电都成问题。微软现在想买过去报废的、出过核事故的旧电站，美国的几个提供小型核电站的公司股票大涨都是AI带起来的，从这些就知道目前美国的AI模型的运营成之高。

crunchtime

3 个月

13 楼

还好留园有嘴炮震天的牲畜金三诚聘腿毛贵军青蛙，可以给大家增加乐趣。

Washington001

3 个月

14 楼

谷歌的前CEO Eric Emerson Schmidt 在几个月前接受采访（就是在斯坦福的讲座），牛逼哄哄地说中国的AI技术水平和美国有2、3年的差距。不久前再接受采访，说中国的AI发展超过他的估计，现在只有几个月的差距了。我自己看来，如果DeepSeek没有吹牛，在技术路线上应该比美国公司都强太多了，至少美国目前没有一个低成本的模型。DeepSeek会有更大的市场竞争力。并且现在DeepSeek开源，市场竞争力要高很多。

据

据说据说

3 个月

15 楼

中国的AI基本上没什么进步。

龙

龙起卷

3 个月

16 楼

肯定有犬粮喷粪……😂😂😂😂留园犬圈特色点就是：见不得任何有关中国的好事

anywho

3 个月

17 楼

DeepSeek比ChatGPT 更好用

xiaoss188g

3 个月

18 楼

这个低素质国家又赢麻了，脸天天都长圆圆的

xiaoss188g

3 个月

19 楼

中国再说多一次厉害美国就给中国再多一次重击。

spirithorse

3 个月

20 楼

别扯了，中国的AI水平，行业内人士自己都清楚，吹破天也没用

caodibian

3 个月

21 楼

梁文峰了不起！中国一定还有张文峰、李文峰、、、、、、。

云

云中故郡

3 个月

22 楼

: 煞笔，滚😡

云

云中故郡

3 个月

23 楼

煞笔，滚😡

Purp_sun

3 个月

24 楼

自媒体真的是……

Hegal.zhang

3 个月

25 楼

滞纳zhu又开始瞎吹了，刚刚下了deepseek v3，实际用起来惨不忍睹，刷榜应该是用测试数据来训练的模型吧，

Hegal.zhang

3 个月

26 楼

台海来一战，杀个几百万街坊军，不然滞国不知道自己斤两了

Hegal.zhang

3 个月

27 楼

看来滞猪确实是外行装内行，居然说电能是瓶颈，你还不如说female researcher的月经是瓶颈更可信一些， OpenAI成本高是因为25000GPU并行训练很困难，而实际应用的推理没有那么费钱，因为大量的任务可以转换到低精度模型（INT8），比如搜索任务简单文本对话，那些推理并行化是很简单的，因为不要传递gradient，电能根本不是问题，现在的问题是scaling Law，你知道什么玩意么？？？？不懂装懂的蜘蛛沙雕？

caodibian

3 个月

28 楼

放狗搜一下会有一大堆，而且是英文的来自以美国为主的近期的评价，不过把头埋进沙子里就什么都没有。

cedarbird

3 个月

29 楼

不是遥遥领先了吗

Hegal.zhang

3 个月

30 楼

刚刚开源试了性能惨不忍睹，当然洗碗的五毛畜生是不会知道怎么下的

slimane

3 个月

31 楼

哈哈哈哈，國內搞ai的朋友一直在哀嚎，他公司以騰訊為首的風投都投了近百億美元了，國內屬於遙遙領先的幾個之一，原來還不如阿貓阿狗。另外機器人啊，國內連個公開展示不摔倒的都沒有，都是視頻剪輯

caodibian

3 个月

32 楼

https://medium.com/data-science-in-your-pocket/deepseek-v3-the-best-open-source-llm-727d3421ae38 这个有评测的打分

donhai

3 个月

33 楼

2021年就囤了1万张英伟达A100 厉害！

donhai

3 个月

34 楼

估计现在在AI方面，应该中国与米国平起平坐，说不定还有超前。但中国人现在学精明了，有了先不说，等米国发表了，然后中国说也有了，逼死你。

djtg

3 个月

35 楼

文里说了技术原理“零一和DeepSeek用的都是MoE（混合专家）模式，相当于是在事先准备的高质量数据集上去做特定训练，不能说在跑分上完全没有水分，但市场并不关心原理，只要质价比够看，就一定会有竞争力。”这里高质量的数据集不出意外是现有的大模型上生产出来的，加上一定量的新数据，这样训练数据会非常“干净”，随便训练一下就有很好的效果，但缺点是应用范围会比原装训练出来的小，所以说有水份。这根本不是什么技术性革命，不过是利用别人的产品，在其基础上改进而已。

santan

3 个月

36 楼

: 你们这几只低级五毛蛆大半夜还得出来喷粪，现在监狱的屎还够你们吃吗？哈哈哈

中

中国人有话说

3 个月

37 楼

中国这是被进步，西方圣母婊，想中国进步的，中国就被进步，想中国崩溃的时候，中国就被崩溃，就如狗粮吃屎的时候会和主子一样，人格分裂。

意

意见没

3 个月

38 楼

How Innovative Is China in AI? 中国在人工智能领域有多创新？ 8/26/2024 https://itif.org/publications/2024/08/26/how-innovative-is-china-in-ai/ ########################## Google search: how advanced is China's AI technology? Answer: 中国的人工智能技术被认为非常先进，在全球排名第二，仅次于美国，在面部识别、大型语言模型和研究出版物等领域具有显著优势，但与美国相比，它在生产高度复杂的半导体和某些核心创新方面仍面临挑战

goodboy22

3 个月

39 楼

: 放屁，你都不知道啥是ai

陆媒:中国AI的进步之快 让美国人怀疑现实了