这一次芯片又卡住了中国研发ChatGPT的脖子

2 年多前

ChatGPT一声惊雷，平静的搜索江湖瞬间风暴骤起。微软高调上线ChatGPT版Bing搜索引擎，逼得Google仓促应战，推出基于LaMDA 模型的同款聊天机器人，结果Bard变bug，反而把自家股价打掉了2000亿美元。

与此同时，百度也宣布自研的“文心一言”正在加速内测，预计三月底问世。

蛰伏已久的科技巨头们同时变得紧张，除了ChatGPT在公众中掀起的热潮，也因为他们预感到ChatGPT所代表的LLM（大语言模型）应用很可能是一种“元技术”。

“元技术”指的是该技术的持续运用可以反过来加速技术本身的进步。例如：芯片在现实世界中的应用能从开发效率，应用场景和资金投入上反哺研发，从而加速芯片本身的进步；“元技术”的发展符合指数增长的规律，因此能够克服研发管理中常见的复杂度爆炸，逃离“中等进步陷阱”的引力束缚。

也正是由于“元技术”的属性，芯片的研发才能够不断实现突破，追上摩尔定律的要求，相比而言生物技术等非“元技术”，则在摘光低垂的果实后搭不出技术升级的垫脚石，从而深陷Eroom’s Law（反摩尔定律）的泥潭。

正如大家体验到的，使用ChatGPT可以极大解放工作效率，这也包括Open AI自己的研发人员。亿级用户对ChatGPT的花式提问和反复测试出的“prompt黑魔法”，也为后续版本的迭代迅速积攒了海量素材。

除此以外，LLM单次训练的巨大成本和对算力资源的占据，也构成了对新玩家残酷的进入壁垒。

随着竞争的加剧，无论是资金还是算力都会理性的向技术领先者集中，从而自我实现“强者愈强”的马太定律。

至此，ChatGPT的“元技术”飞轮，隐隐已形成闭环。所以，如果没有在“技术奇点”前及时上车，已有科技巨头和OpenAI在AI应用上差距将不可逆的拉大，最终陷入万劫不复的螺旋衰落；而那些小型AI创业团队，面对模型代差和资源无法弥补的差距，灭顶之灾已然到来。

而在更高的层面上，作为“元技术”的ChatGPT可能对中国的未来具有核弹级的震荡性。

过去十年中国科技产业的进展，靠的是“fast follow”和工程化上充满暴力美学的 “饱和式执行”。而这背后所依托的，则是国内教育体制带来的“工程师福利”。

虽然培养不出S级的创新人才，但产出的B级标品量大管饱：稳定、勤奋、执行力强、而且还相当便宜，可以迅速填平从源头创新到应用落地的时间差距，直接把海外的原创者给卷没了。

但ChatGPT作为史上最优秀的复读机，恰好和“中国机器人”的功能重合了。

你会的我也会，你不懂的我还懂，你能996，但我能365天007，你行吗？更何况ChatGPT还不是人，无负面情绪之乱耳，无柴米油盐之劳形，不会辞职，绝不躺平。

熟练运用ChatGPT相当于雇了一个随叫随到，皮实耐造，拥有各知识领域基础技能的助理团队。

对眼高过顶的S级创新者而言， ChatGPT为其想法的prototype落地提供了全天候的助力；对集聚S级人才的创新企业而言，ChatGPT则意味着执行落地不再成为主要的发展瓶颈。而人员规模的瘦身和智力浓度的提升，还能进一步减少内部信息传导的损耗，如只有四百人的Open AI那样敏捷高效。

在这种情况下，使用开源框架fast follow的大厂策略还能产生规模效应吗？即便还能压缩出成本优势，也会在时间效率上遭遇降维打击。国内有人常常嘲笑美国大学在产出少量S级和A级精英的同时，却制造了一堆垃圾，以至于要从中印长期进口B级好员工；现在可能要笑不出来了。

过去擅长的骑射武功突然过时了，而机关枪对射的世界里没有你的位置。因此，如果BAT没有抢到此轮ChatGPT的船票，科技产业将错失这一致命的“奇点时刻”。遗憾的是，国内众多玩家不但在模型上被拉开身位，在算力和数据上也即将甚至已经面临极大的限制。

LLM对算力的吞噬是贪婪的，GPT-3 的1750亿参数（45.3T）模型单次训练需要1024张NVIDA A100 GPU训练34天。但是，目前A100这个级别的芯片是禁运的。接下来，GPT-4需要的算力可能会继续增加两个数量级，我们那时候用什么芯片来追赶呢？毕竟现在连45nm制程的光刻机都要被禁运了。

芯片禁运对国内AI技术的压制堪称智子锁死。

有人说这没关系，可以通过叠加成熟制程的芯片以量换质，或是慢点训练最终也能达到同等技术水平。芯片禁运，本来就不是为了一锤子打死你，而是通过增加中国科技企业的算力成本，让任何AI应用的落地在财务上不可行（甚至在热力学上都不可行），搞得你只能在利润失血和被迫缴械之间二选一，无法进入良性业务循环。

只要持续禁运，拖慢对手的进程，在过了“奇点时刻”后，“元技术”的代差可能就无法收敛了。如果新一轮LLM输出的成果反哺到芯片研发的流程，那么这种速度差距将会进一步拉开。

而在数据来源上，微软和Google依托的是超主权的全球互联网文本。以CPT-3为例，数据主要来自Common Crawl，共31亿个页面，覆盖了2016-2021年间的互联网文本数据，并用WebText2作为高质量文档类对原始数据进行了质量过滤；此外还导入2个图书库和Wikipedia进行了额外补充。

BAT所依托的中文互联网，在量级上不够（Common Crawl里中文数据不到5%），而且数据生态也不够好。

大部分中文页面的信息可信度还不如百度贴吧，极少的高质量数据则被圈在各个厂家私域的“围墙花园”中，而且有相当多的链接打开后是404。至于用结构化数据库进行补充，你指的是知网和百度百科这对哼哈二将吗？

以这种质量和结构性缺失的数据集进行训练，结果很可能是garbage in garbage out的废话生成器，就比如百度匆匆下线的Plato杠精机器人。

而在当前的数据主权和信息安全规范下，利用海外数据“西数东算”再翻译回中文也困难重重。更深一层思考，又如何剔除“进口模型”中内隐的意识形态植入？“根据相关法律，本答案不予显示”？精明如微软，一开始就封掉了中国IP使用ChatGPT版Bing搜索引擎的权限，割以永治。

致命的奇点时刻，正在敲响警钟。

Phillip

2 年多

1 楼

卡住脖子好啊,有机会翻白眼。 [1评]

aamamamia

2 年多

2 楼

恨人有笑人无，没有时是个喋喋不休的怨妇，有了变身得志小人 [1评]

duffer9

2 年多

3 楼

卡的好啊，白眼战狼，卡的就是这样的。新冠始发国，偷着乐吧！

沙

沙漠之狐

2 年多

4 楼

就研发不了，何必把这个无能的锅用芯片遮住那。 - 坦诚相待，大胆承认。之后奋勇争先即可。这样永远都不会进步

沙

沙漠之狐

2 年多

5 楼

感觉咱们头以下，脚踝以上全是脖子，什么都卡脖子。

错

错错错错错

2 年多

6 楼

感觉ChatGPT这不是好事。有了计算器，很多学生最基本的算术离开了计算器，都不会了。再来，手机普及以后，谁还会手写中文，提笔忘字已经是常态了。再有这个“ChatGPT”，人类将会越来越懒，懒到最后都不想思考了……… 不过，这应该交给顶尖菁英去解决，老百姓过一天算一天。 [1评]

Ai3x3

2 年多

7 楼

大陆已经被隔离了，现在只是开始

GoE

2 年多

8 楼

大部分人失业之日，就是决定AI命运之时

Phillip

2 年多

9 楼

嗯，还是用算盘好。

dingding6

2 年多

10 楼

人依靠科技越来越多，好像有点反作用了。基本的写字，数学都会被淘汰。

月

月下偷心人

2 年多

11 楼

二楼说得好国内就是这样一个德行。墙内人社会里，人与人之间就多是这种小人态度。换到整体对外，也是这种小人态度。现在墙内从头到脚，从个人到整体都是这种禽兽小人文化。。。唉。。。

melbguy1

2 年多

12 楼

天天吹中国人工智能多厉害。搞了半天还是跟着别人屁股后面。

无

无视生非

2 年多

13 楼

看看中国的航天成果不知脑残狗粮作何感想？

zk100yyy

2 年多

14 楼

还要教AI说谎。肯定调适需要很久。

gengzhi

2 年多

15 楼

华为呢？吹了半天。 [1评]

leonardojin

2 年多

16 楼

HTC摩托罗拉呢哈哈哈哈哈

leonardojin

2 年多

17 楼

: 卡你脖子估计会出屎

moonray

2 年多

18 楼

怕啥，北大手工打磨0.85纳米芯片拿出来不是吓屎全宇宙

沙

沙发

2 年多

19 楼

百度就不要蹭热度了，把现在的破烂搜索引擎做好是正事

网

网络激活

2 年多

20 楼

没有美国芯片，人工智能，大数据都得趴窝就这还敢和老美叫板呢掐死丫的活鸡巴该哈哈哈哈

evision

2 年多

21 楼

中国只需要新闻联播，学习强国。有什么事问胡公公就好，问什么人工智障。

EmmaLiu的老公

2 年多

22 楼

这篇文章写的好：但是把三个问题混在一起了 0）中国人才不行，没有S级人才，有的是B级韭菜 1）算力不够 2）中文互联网内容不行，言论有审核然后揉在一起，中或最输…其实换个思路就可以得出很不同的结论 0）人才不行是无稽之谈，美国搞AI，ML的，至少三分之一是中国人，人才资源不成问题，怎么请他们回去，给他们创造环境才是问题。而且中国国内的AI，ML是除美国外最强的，人才资源不是问题（但是要保证生育率）但是要怎么把人才引流回去 1）算力不足，可以减小数据量，可以增加训练时间，可以分领域单独训练，再整合，目前算力不是问题，至于用chatgpt做芯片研发，现在还看不到影子，只要中国不被落差太远（5-10年）突破之后就是拼制造业了（这是中国的优势……，制造倒逼创新……迅速迭代） 2）中文网内容不行，呵呵这个问题最好解决，一个李永乐老师超过多少其他upper？让AI看片，看好片就好了，中国有最好的中文内容和整合能力，内容不是问题其实中国最重要的问题是生育率……，有人才有人才，官老爷们，想想怎么多生人吧，有人才怎么才能利用好吧……

OolongTea

2 年多

23 楼

13楼]评论人:无视生非 [ 看看中国的航天成果不知脑残狗粮作何感想？自1949年，對中國卡脖子何時停過，每次都說中國要崩潰了，到現在都未見到。 [1评]

怪

怪叔叔的大发现

2 年多

24 楼

小编的脖子被编辑卡的死死的

EmmaLiu的老公

2 年多

25 楼