这一次 芯片又卡住了中国研发ChatGPT的脖子

今日头条
Toutiao
最新回复:1969年12月31日 16点0分 PT
  返回列表
72944 阅读
46 评论
凤凰网

ChatGPT一声惊雷,平静的搜索江湖瞬间风暴骤起。微软高调上线ChatGPT版Bing搜索引擎,逼得Google仓促应战,推出基于LaMDA 模型的同款聊天机器人,结果Bard变bug,反而把自家股价打掉了2000亿美元。

与此同时,百度也宣布自研的“文心一言”正在加速内测,预计三月底问世。

蛰伏已久的科技巨头们同时变得紧张,除了ChatGPT在公众中掀起的热潮,也因为他们预感到ChatGPT所代表的LLM(大语言模型)应用很可能是一种“元技术”。

“元技术”指的是该技术的持续运用可以反过来加速技术本身的进步。 例如:芯片在现实世界中的应用能从开发效率,应用场景和资金投入上反哺研发,从而加速芯片本身的进步;“元技术”的发展符合指数增长的规律,因此能够克服研发管理中常见的复杂度爆炸,逃离“中等进步陷阱”的引力束缚。

也正是由于“元技术”的属性,芯片的研发才能够不断实现突破,追上摩尔定律的要求,相比而言生物技术等非“元技术”,则在摘光低垂的果实后搭不出技术升级的垫脚石,从而深陷Eroom’s Law(反摩尔定律)的泥潭。

正如大家体验到的,使用ChatGPT可以极大解放工作效率,这也包括Open AI自己的研发人员。亿级用户对ChatGPT的花式提问和反复测试出的“prompt黑魔法”,也为后续版本的迭代迅速积攒了海量素材。

除此以外,LLM单次训练的巨大成本和对算力资源的占据,也构成了对新玩家残酷的进入壁垒。

随着竞争的加剧,无论是资金还是算力都会理性的向技术领先者集中,从而自我实现“强者愈强”的马太定律。

至此,ChatGPT的“元技术”飞轮,隐隐已形成闭环。所以,如果没有在“技术奇点”前及时上车,已有科技巨头和OpenAI在AI应用上差距将不可逆的拉大,最终陷入万劫不复的螺旋衰落;而那些小型AI创业团队,面对模型代差和资源无法弥补的差距,灭顶之灾已然到来。

而在更高的层面上,作为“元技术”的ChatGPT可能对中国的未来具有核弹级的震荡性。

过去十年中国科技产业的进展,靠的是“fast follow”和工程化上充满暴力美学的 “饱和式执行”。而这背后所依托的,则是国内教育体制带来的“工程师福利”。

虽然培养不出S级的创新人才,但产出的B级标品量大管饱:稳定、勤奋、执行力强、而且还相当便宜,可以迅速填平从源头创新到应用落地的时间差距,直接把海外的原创者给卷没了。

但ChatGPT作为史上最优秀的复读机,恰好和“中国机器人”的功能重合了。

你会的我也会,你不懂的我还懂,你能996,但我能365天007,你行吗?更何况ChatGPT还不是人,无负面情绪之乱耳,无柴米油盐之劳形,不会辞职,绝不躺平。

熟练运用ChatGPT相当于雇了一个随叫随到,皮实耐造,拥有各知识领域基础技能的助理团队。

对眼高过顶的S级创新者而言, ChatGPT为其想法的prototype落地提供了全天候的助力;对集聚S级人才的创新企业而言,ChatGPT则意味着执行落地不再成为主要的发展瓶颈。而人员规模的瘦身和智力浓度的提升,还能进一步减少内部信息传导的损耗,如只有四百人的Open AI那样敏捷高效。

在这种情况下,使用开源框架fast follow的大厂策略还能产生规模效应吗?即便还能压缩出成本优势,也会在时间效率上遭遇降维打击。国内有人常常嘲笑美国大学在产出少量S级和A级精英的同时,却制造了一堆垃圾,以至于要从中印长期进口B级好员工;现在可能要笑不出来了。

过去擅长的骑射武功突然过时了,而机关枪对射的世界里没有你的位置。因此,如果BAT没有抢到此轮ChatGPT的船票,科技产业将错失这一致命的“奇点时刻”。遗憾的是,国内众多玩家不但在模型上被拉开身位,在算力和数据上也即将甚至已经面临极大的限制。

LLM对算力的吞噬是贪婪的,GPT-3 的1750亿参数(45.3T)模型单次训练需要1024张NVIDA A100 GPU训练34天。但是,目前A100这个级别的芯片是禁运的。接下来,GPT-4需要的算力可能会继续增加两个数量级,我们那时候用什么芯片来追赶呢?毕竟现在连45nm制程的光刻机都要被禁运了。

芯片禁运对国内AI技术的压制堪称智子锁死。

有人说这没关系,可以通过叠加成熟制程的芯片以量换质,或是慢点训练最终也能达到同等技术水平。芯片禁运,本来就不是为了一锤子打死你,而是通过增加中国科技企业的算力成本,让任何AI应用的落地在财务上不可行(甚至在热力学上都不可行),搞得你只能在利润失血和被迫缴械之间二选一,无法进入良性业务循环。

只要持续禁运,拖慢对手的进程,在过了“奇点时刻”后,“元技术”的代差可能就无法收敛了。如果新一轮LLM输出的成果反哺到芯片研发的流程,那么这种速度差距将会进一步拉开。

而在数据来源上,微软和Google依托的是超主权的全球互联网文本。以CPT-3为例,数据主要来自Common Crawl,共31亿个页面,覆盖了2016-2021年间的互联网文本数据,并用WebText2作为高质量文档类对原始数据进行了质量过滤;此外还导入2个图书库和Wikipedia进行了额外补充。

BAT所依托的中文互联网,在量级上不够(Common Crawl里中文数据不到5%),而且数据生态也不够好。

大部分中文页面的信息可信度还不如百度贴吧,极少的高质量数据则被圈在各个厂家私域的“围墙花园”中,而且有相当多的链接打开后是404。至于用结构化数据库进行补充,你指的是知网和百度百科这对哼哈二将吗?

以这种质量和结构性缺失的数据集进行训练,结果很可能是garbage in garbage out的废话生成器,就比如百度匆匆下线的Plato杠精机器人。

而在当前的数据主权和信息安全规范下,利用海外数据“西数东算”再翻译回中文也困难重重。更深一层思考,又如何剔除“进口模型”中内隐的意识形态植入?“根据相关法律,本答案不予显示”?精明如微软,一开始就封掉了中国IP使用ChatGPT版Bing搜索引擎的权限,割以永治。

致命的奇点时刻,正在敲响警钟。

P
Phillip
1 楼
卡住脖子好啊,有机会翻白眼。 [1评]
a
aamamamia
2 楼
恨人有笑人无,没有时是个喋喋不休的怨妇,有了变身得志小人 [1评]
d
duffer9
3 楼
卡的好啊,白眼战狼,卡的就是这样的。 新冠始发国,偷着乐吧!
沙漠之狐
4 楼
就研发不了,何必把这个无能的锅用芯片遮住那。 - 坦诚相待,大胆承认。之后奋勇争先即可。这样永远都不会进步
沙漠之狐
5 楼
感觉咱们头以下,脚踝以上全是脖子,什么都卡脖子。
错错错错错
6 楼
感觉ChatGPT这不是好事。 有了计算器,很多学生最基本的算术离开了计算器,都不会了。 再来,手机普及以后,谁还会手写中文,提笔忘字已经是常态了。 再有这个“ChatGPT”,人类将会越来越懒,懒到最后都不想思考了……… 不过,这应该交给顶尖菁英去解决,老百姓过一天算一天。 [1评]
A
Ai3x3
7 楼
大陆已经被隔离了,现在只是开始
G
GoE
8 楼
大部分人失业之日,就是决定AI命运之时
P
Phillip
9 楼
嗯,还是用算盘好。
d
dingding6
10 楼
人依靠科技越来越多,好像有点反作用了。基本的写字,数学都会被淘汰。
月下偷心人
11 楼
二楼 说得好 国内就是这样一个德行。 墙内人社会里,人与人之间就多是这种 小人态度。 换到整体对外,也是这种小人态度。 现在墙内从头到脚,从个人到整体都是这种禽兽小人文化。。。唉 。。。
m
melbguy1
12 楼
天天吹中国人工智能多厉害。搞了半天还是跟着别人屁股后面。
无视生非
13 楼
看看中国的航天成果不知脑残狗粮作何感想?
z
zk100yyy
14 楼
还要教AI说谎。肯定调适需要很久。
g
gengzhi
15 楼
华为呢? 吹了半天。 [1评]
l
leonardojin
16 楼
HTC摩托罗拉呢哈哈哈哈哈
l
leonardojin
17 楼
: 卡你脖子估计会出屎
m
moonray
18 楼
怕啥, 北大手工打磨0.85纳米芯片拿出来不是吓屎全宇宙
沙发
19 楼
百度就不要蹭热度了,把现在的破烂搜索引擎做好是正事
网络激活
20 楼
没有美国芯片,人工智能,大数据都得趴窝 就这还敢和老美叫板呢 掐死丫的活鸡巴该 哈哈哈哈
e
evision
21 楼
中国只需要新闻联播,学习强国。有什么事问胡公公就好,问什么人工智障。
E
EmmaLiu的老公
22 楼
这篇文章写的好:但是把三个问题混在一起了 0)中国人才不行,没有S级人才,有的是B级韭菜 1)算力不够 2)中文互联网内容不行,言论有审核 然后揉在一起,中或最输…其实换个思路就可以得出很不同的结论 0)人才不行是无稽之谈,美国搞AI,ML的, 至少三分之一是中国人,人才资源不成问题,怎么请他们回去,给他们创造环境才是问题。而且中国国内的AI,ML是除美国外最强的,人才资源不是问题(但是要保证生育率)但是要怎么把人才引流回去 1)算力不足,可以减小数据量,可以增加训练时间,可以分领域单独训练,再整合,目前算力不是问题,至于用chatgpt做芯片研发,现在还看不到影子,只要中国不被落差太远(5-10年) 突破之后就是拼制造业了(这是中国的优势……,制造倒逼创新……迅速迭代) 2)中文网内容不行,呵呵 这个问题最好解决,一个李永乐老师超过多少其他upper? 让AI看片,看好片就好了,中国有最好的中文内容和整合能力,内容不是问题 其实中国最重要的问题是生育率……,有人才有人才,官老爷们,想想怎么多生人吧,有人才怎么才能利用好吧……
O
OolongTea
23 楼
13楼]评论人:无视生非 [ 看看中国的航天成果不知脑残狗粮作何感想? 自1949年,對中國卡脖子何時停過,每次都說中國要崩潰了,到現在都未見到。 [1评]
怪叔叔的大发现
24 楼
小编的脖子被编辑卡的死死的
E
EmmaLiu的老公
25 楼
俄罗斯航天也很强,看看现在俄乌战争…… 这个话题你不懂就学习一下,虚心一点吧 好学近乎智
k
kooo
26 楼
没关系的,包子只要能当皇帝,下面骑着的就是全部是五毛小粉蛆虫,他也是高兴的,也还会给世界指明方向的。
t
targer
27 楼
习思想比人工智能强10000倍,是无所不知无所不能的。 [1评]
O
OolongTea
28 楼
25楼]评论人:EmmaLiu的老公 这个曆始你不懂就学习一下,看看韓戰 再现在俄乌战争… 韓戰 你老味(美) 都無打贏土共(窮到窿) 加部份俄國空軍參戰)。現俄國佬,有無盡的油和糧食,看誰耗得過?
b
bignoseyan
29 楼
哈哈哈,中国人的AI一定后来居上,美国想卡中国人的脖子,是痴心妄想!
y
youmyyou2016
30 楼
你这恶心下贱的傻逼 内心是多肮脏
y
youmyyou2016
31 楼
臭傻逼轮子,不黑中国活不下去了
一分为二好
32 楼
好大喜功和过早放弃韬光养晦的后遗症越来越严重了。
青蛙
33 楼
哈哈 這次吊在反人類新法西斯俄孫黃禍紅畜脖子上的正是它們自己的敏感詞系統
a
abc868
34 楼
用伟人红太阳杂种书记思想发中国画饼充饥梦幸福死了俄爷爷生下的十四亿龟孙子!
w
wushang
35 楼
难得认同的中文文章
布左右行中道
36 楼
中國還有很長的路要走、但西方的工業化己走二百多年、中國開放才四十多年、以前聽信科學無國界的中國政府一直在努力、 西方白皮再怎麼好關站不起來的支豬狗糧啥事啊?! 關跪著的糞坑墻島河漂礦台巴鳥事啊? 二十一世紀名符其實的支那東亞病夫賤畜是:一直站不起來的倭霉狗糧奴、流浪礦台巴蛆
布左右行中道
37 楼
新冠來自歐美! 站不起來的支豬狗糧、糞坑墻島喝地溝油腦殘跪著的詐騙倭霉賤畜、河漂礦學不來的、 沒有專業知識的腦殘詐騙台巴蛆、學倭爹撿垃圾擺拍炫耀,就地截肢鉅手腳殺人犯台巴所謂的救援隊、被土耳其驅逐出境的劣根性詐騙蛆、世界小
g
gescan
38 楼
404你能怨这些科技企业?傻逼中共自己造的孽,活鸡巴该!
s
superspider
39 楼
这两年真不知道国内在搞个什么东西。全都在他娘的封禁封控。产业萧条,经济衰退。
u
ucan
40 楼
中国的人才,都跑到这里反共来了。
一人分饰两角
41 楼
三年前的GPT-2已经超神了,主流媒体大规模注意到GPT-3的一个分支应用ChatGPT的时候其实已经是风口的尾声了。
罗马军团
42 楼
就是新冠3年期间,GTP猥琐发育。大众当然都被疫情折腾得焦头烂额,注意力都在疫情上,特别是中国更是直接闭关锁国。
罗马军团
43 楼
其实GPT对中国来说最无解的是就算直接免费让你用你还不敢用,lol
天罡
44 楼
这个SB狗粮文章。chat GPT并没有任何创新性,只是高级搜索引擎,没有任何智力,这东西中国可以搞,也可以用。就看这个新冠疫情就可以看出,美国佬并没有找到解决问题方法,只是堆一大堆这样那样玩意,这种所谓大数据来的东西,在原创面前就得现原形。
燃烧的褪毛
45 楼
百度就别掺和了,丢人现眼,问啥啥都不能说
c
csccpmz
46 楼
“韓戰 你老味(美) 都無打贏土共(窮到窿)” ------》然后共军在美军制定的停战协议上签字。