院士:什么时候中国算力超美,GDP也就有望超美了

今日头条
Toutiao
最新回复:2023年7月9日 9点21分 PT
  返回列表
74650 阅读
48 评论
观察者网

刚刚在上海闭幕的第六届世界人工智能大会(WAIC),火爆程度可谓历届之最。在会上,AI大模型是当之无愧的焦点,而芯片和算力作为大模型的基础,也成为与会专家学者口中的高频词。

“没有大算力,做大模型就是天方夜谭。”本届WAIC期间,中国工程院院士、鹏城实验室主任高文在昇腾人工智能产业高峰论坛上演讲时直言,使用算力训练大模型,就像工业中使用电力一样,想靠省电做出什么产品来,真正懂行的人听了都不信,大模型一定要有算力作为基础。

他指出,算力已成为数字经济发展中的一个指数,美国的算力指数现在排名全球第一,比中国大概多了20%-30%的算力,GDP也比中国多20%-30%,“什么时候我们的算力超越了美国,咱们的GDP也就有望超越美国了。所以发展人工智能和数字经济,没有匹配的算力是不可能的。”

图源:观察者网

根据工信部数据,截至2022年底,我国算力总规模已达180EFLOPS,近五年平均增速超30%,算力规模排名全球第二。但这其中很大一部分是通用算力,而不是更适合大模型训练的智能算力。

中国信通院发布的《中国算力指数发展白皮书(2022)》显示,中美在全球算力规模中的份额分别为33%、34%,其中基础算力分别为26%、37%,智能算力分别为28%、45%,超级算力分别为18%、48%。

建设更多的智能算力,成为中国AI产业向前发展的当务之急。

据高文介绍,鹏城实验室已经与华为合作,建设了大规模AI计算集群“鹏城云脑Ⅱ”,该集群搭载了约4000颗华为昇腾AI芯片,相当于4000块英伟达A100 GPU的算力,目前算力规模是1000P,并且该集群实现全栈软硬件自主可控,蝉联多项全球AI性能榜单冠军。

他近期在深圳一场讲座上还曾提到,“鹏城云脑II”作为国内首个全面自主可控的E级智能算力平台,当前的性能以及人工智能算力水平达到国际领先。目前,“鹏城云脑II”有超过七成的机时对外开放服务,已支撑起诸多国产AI大模型的训练。

高文还透露,下一代鹏城云脑正在筹建中,其算力将是“鹏城云脑II”的16倍,建成后能更好支撑6G技术和人工智能大模型训练,有望成为国际首个支撑新一代智能网络通信创新研究的重大科学基础设施和国内首个支持数据密集型智慧科学研究的大科学装置。

根据高文在本届WAIC上披露的信息,“鹏城云脑III”预计2024年底到2025年初建成,算力将达到16E,也就是16000P智能算力。

图源:观察者网

官网介绍,鹏城实验室是中央批准成立的突破型、引领型、平台型一体化的网络通信领域新型科研机构。实验室聚焦宽带通信、新型网络、网络智能等国家重大战略任务以及粤港澳大湾区、中国特色社会主义先行示范区建设的长远目标与重大需求,开展领域内战略性、前瞻性、基础性重大科学问题和关键核心技术研究。

以下是高文院士演讲全文(观察者网根据现场讲话整理,未经本人确认):

各位专家、各位领导,大家下午好!

前面的领导都讲的很好,算力是非常重要的一件事,今天上午陈书记也讲到,上海要抓三件大事,人工智能领域,算力建设是非常重要的一方面,就像电力一样,原来李克强总理抓经济的时候,有一个很重要的指数就是“克强指数”,是靠电力消耗看整个经济发展顺不顺利,或者是正常不正常。

从现在开始,算力也是数字经济发展的一个指数。算力够,数字经济就能发展好,不够就发展不好。所以,算力建设尤其是智能算力建设就非常关键。我在这里,跟大家分享关于鹏城云脑的智算平台,另外是分享一下,在这个平台上做的鹏城脑海大模型。

首先算力很重要,但重要到什么程度呢?清华大学一个2022年的咨询报告提到,经过统计,算力指数和GDP是正相关的,一个国家算力越强,GDP就越强。美国现在算力指数排第一,比我们大概多了20%-30%的算力,GDP也比我们多20%-30%,什么时候我们的算力超越美国,咱们的GDP也就有望超越美国了。

正是因为算力这么重要,所以发展人工智能和数字经济,没有匹配的算力是不可能的。要有算力,就要有芯片,芯片做成机器,才能用这个机器训练模型。

为了做这件事,我们2020年在深圳做了一台机器叫鹏城云脑Ⅱ。在2020年,这台机器的算力是全世界做人工智能训练最强的,比当时微软、谷歌的机器都要强,相当于4000块英伟达A100 GPU的算力,而且这台机器是用全光网络连接的,节点之间延迟非常低。

因为有了这台机器,我们就可以做很多事,包括做科学研究、产业应用还有关键技术的研发。这台机器刚刚我说有4000块卡,其中一方面是鲲鹏CPU,另外是昇腾NPU,都是华为的。

图源:观察者网

那么这台机器的性能行不行呢?我们就参加世界TOP500的超算打榜,整个超算打榜也有其他的赛道,我们参加的是IO500的赛道,是一条考验输出和输入能力的赛道,从2020年10月份这台机器做出来以后,我们11月份就参加打榜,连续6次第一,每半年有一次打榜,全节点连续两次第一。

所以做人工智能训练这件事,别人没办法和这台机器比。这台机器不仅硬件强,接口能力和网络也非常强,同时上面的软件也配备得比较完备,包括怎么样做分布式计算,怎么样做命令调优、自研调度规划等等。

也许有的专家听到过,有人说全世界能在1000块卡上同时训练一个模型的只有几千人,能在4000块卡上训练的不超过100个人,在10000块卡上训练模型的人数更少了。在大规模的卡上一起做事,对于软件规划、资源调度挑战非常大。

我们不仅是把鹏城云脑Ⅱ用好,同时也承担了国家发改委的任务,把华为生态包括昇腾AI集群的算力,不论是100P或900P的算力结点,用网络把资源连起来,可以向外界提供。同时按照发改委的要求,希望这是异构的算力网平台,我们在华为生态以外,也选择了部分其他厂商的算力,在2022年6月这个项目验收的时候,已经聚合的智能算力达到2300P,鹏城云脑Ⅱ只是1000P,而这个系统已经聚集了2300P的智能算力。

有了鹏城云脑Ⅱ可以训练大模型了,但训练大模型还是很费算力的,即使可以训练大模型,现在的算力供给根本不够用,因此我们正在规划做鹏城云脑Ⅲ。

下面我说说大模型。

鹏城实验室正在做一个2000亿参数的大模型,也就是200B的参数,为什么做这件事呢?因为有ChatGPT和类ChatGPT大模型在不停涌现,同时现在很多公司都用这个东西做产业应用,去做服务。所以现在模型变得很重要了,但现在有钱的公司可以砸几个亿做这样的机器,甚至十几个亿和几十个亿,而大多数公司是做不了的。

图源:观察者网

这个领域需求这么大,怎么办?鹏城实验室可以做一个底座,把模型训练完开放出去,大家在这个底座上做垂直应用。按照这样的思路,我们首先有鹏城云脑Ⅱ的算力,前一阶段我们积累了很多数据,这一段时间我们通过各个渠道,包括购买,拿到数据先做清洗,清洗数据的工作很重,可能拿到100个数据,清洗完就剩几个了,因为有很多是重复和不规范的数据,这些东西拿掉后,数据量就变得很小。虽然拿了很多数据,但是真正用来做训练的数据只有1%-5%。有了这些数据,我们就可以做大模型底座。

这个大模型底座用的就是生成式预训练模型,也就是和GPT完全类似的底层。现在这个2000亿参数规模的大模型训练出来以后,我们希望把它给到合作伙伴那里,而且提供相应的指令微调和相应的人工增强学习的工具,甚至在一两个垂直领域作为垂直应用样板。因为华为在这方面很有经验,我们建议谁想做垂直应用,可以找华为获得一些咨询。

我们希望能快速把这个模型做完推向社会,让业界在这个模型上,开发中国自己的人工智能大模型应用系统。现在我们正在紧锣密鼓地往前推,应该是8月底第一次训练就完成了,9月份就会把模型开放出去。

现在训练的数据有多大呢?我们说的是喂数据,每天喂10个B,但是最重要的是喂一个T的数据,而一个T是由几百个T清洗来的,现在数据都是中文和代码数据,4000多块卡的机器每天可以吃掉10个B,100天就能吃掉1000个B,也就是一个T,因此训练2000亿参数的模型,需要4000块卡训练100天。

这就是算力的重要性,如果算力不足的话,做一个模型还是很辛苦的,而且现在这个模型才训练一个T的数据,如果训练两到三个T的话,还要加两到三个100天,没有大算力做大模型就是天方夜谭。实际上这就和电力是一样的,想靠省电做出什么产品来,真正懂行的人听了都不信,一定要有算力作为基础。

图源:观察者网

怎么样把数据做好、训练的快,我们有一套体系。

有个开源社区叫启智开源社区,这里有很多工程师在做飞轮数据工程,可以使清洗数据做得非常快,有很多自动和半自动的清洗数据。同时我们要考虑应用的时候有隐私数据,有一些数据应用者,希望到这个模型应用一下,但是不希望自己的数据被丢掉或者是被看到,我们也提供了隐私数据保护的模块。

我们希望鹏城脑海大模型训练出来以后,可以快速向社会赋能,可以让大家做数字政府、一带一路、智能制造、智慧金融、智慧医疗等各种各样的应用。而且我们还有完整的教育计划、人才计划,希望通过高校和合作伙伴培养更多AI人才,能让中国的大模型应用快速启动。

总结一下,鹏城实验室在鹏城云脑Ⅱ硬件平台和鹏城脑海大模型这两件事上,都在和华为合作往前推进,希望可以对中国人工智能大模型的应用贡献一点力量。作为一个基石,希望大家多关心、多参与。

h
htchh
1 楼
无知!!不代表你无耻!!!
d
daoshi5179
2 楼
“中美在全球算力规模中的份额分别为33%、34%,其中基础算力分别为26%、37%,智能算力分别为28%、45%,超级算力分别为18%、48%。 ” 中国各项算力都远低于美国,为啥算力规模和美国非常接近呢,这是怎么统计的?
D
DonaldTramp
3 楼
本末倒置了吧,应该是中国gdp超过美国了,算力就有望超过美国。毕竟算力这个东西是国家整体国力的体现。 [1评]
爱吃花生
4 楼
美国要对支那禁运所有芯片,彻底扒掉这个国家的内裤
爱吃花生
5 楼
支那这种低能国家,院士的见识也就是小学生水平
j
jujubi
6 楼
傻逼院士啊!到现在了还要吹牛。美国芯片技术一卡,你们通通翻白眼,只能造42纳米以下的芯片,什么麒麟芯片统统歇菜。你低调一点也不会死啊。 [2评]
s
sws6park
7 楼
大部分算力被滥用了。大道至简。而简化可不是容易的。大数据分析计算在眼下要算力算法二者并举。没有强大的数学基础,野蛮计算基本是浪费算力。大部分商业决策是基于至简的优化模型/算法。
c
caozhiqiham
8 楼
今天也会有很多墙内劳改饭出来骂街吗 [1评]
斯文的地主
9 楼
中国共产党万岁! . 我们这代华人都是看着解放台湾全过程! 台湾人罪孽深重 ,解放台湾 铲平邪教! 台湾一解放!邪教法轮狗、邪教自焚轮子狗、64反华余孽、外逃在外靠反华活命的野狗都会死无葬身之地 。 . 海外华人都是亲眼见证中国一步步强大 统一台湾省! . 海外华人支持习近平! 海外华人支持中国政府所有的决策决定! . . .
福港
10 楼
傻逼,不代表你可以吹你妈逼死牛逼!
牛皮方糖
11 楼
只要皇帝掐指一算,算力无边,普渡众生,仙福永享,遗臭万年!
金拱门汉堡包
12 楼
总量超过容易,人均超越难 [1评]
a
abc868
13 楼
全世界新年最美好的祝愿: 斯文的地主全家族满门老少新年春节车祸碎尸截肢正在顺利拼凑中! 斯文的地主全家大年初一专用骨灰盒五毛已经顺利拼凑好! 祝斯文的地主全家新年在奈何桥愉快! 斯文的地主全家族满门老少新年春节车祸碎尸截肢正在顺利拼凑中! 斯文的地主全家大年初一专用骨灰盒五毛已经顺利拼凑好! 祝斯文的地主全家新年在奈何桥愉快! 全世界新年最美好的祝愿: 斯文的地主全家族满门老少新年春节车祸碎尸截肢正在顺利拼凑中! 斯文的地主全家大年初一专用骨灰盒五毛已经顺利拼凑好! 祝斯文的地主全家新年在奈何桥愉快! 斯文的地主全家族满门老少新年春节车祸碎尸截肢正在顺利拼凑中! 斯文的地主全家大年初一专用骨灰盒五毛已经顺利拼凑好! 祝斯文的地主全家新年在奈何桥愉快!
a
abc868
14 楼
全世界新年最美好的祝愿: 斯文的地主全家族满门老少新年春节车祸碎尸截肢正在顺利拼凑中! 斯文的地主全家大年初一专用骨灰盒五毛已经顺利拼凑好! 祝斯文的地主全家新年在奈何桥愉快! 斯文的地主全家族满门老少新年春节车祸碎尸截肢正在顺利拼凑中! 斯文的地主全家大年初一专用骨灰盒五毛已经顺利拼凑好! 祝斯文的地主全家新年在奈何桥愉快! 全世界新年最美好的祝愿: 斯文的地主全家族满门老少新年春节车祸碎尸截肢正在顺利拼凑中! 斯文的地主全家大年初一专用骨灰盒五毛已经顺利拼凑好! 祝斯文的地主全家新年在奈何桥愉快! 斯文的地主全家族满门老少新年春节车祸碎尸截肢正在顺利拼凑中! 斯文的地主全家大年初一专用骨灰盒五毛已经顺利拼凑好! 祝斯文的地主全家新年在奈何桥愉快!
斯文的地主
15 楼
全世界华人 就连和社会都是爱国! 来国美国日本 那么多国人,都很奇怪 在美国 在日本反华狗敢冒头那是要打死的! . 中国共产党万岁! . 我们这代华人都是看着解放台湾全过程! 台湾人罪孽深重 ,解放台湾 铲平邪教! 台湾一解放!邪教法轮狗、邪教自焚轮子狗、64反华余孽、外逃在外靠反华活命的野狗都会死无葬身之地 。 . 海外华人都是亲眼见证中国一步步强大 统一台湾省! . 海外华人支持习近平! 海外华人支持中国政府所有的决策决定! . . .
g
g10狗粮
16 楼
为什么一定要超美?脑子进大便💩 [1评]
q
qqworker
17 楼
你一个小学都没毕业的。。说院士是傻逼。。
斯文的地主
18 楼
这个就是民间情怀! 我们普通人都是看着中国一步步前进 超越美国! . 知识点: 我最早留言是 中国自强! 我现在留言是 中国和美国平起平坐! 接下来留言是 全球华人见证历史 解放台湾 超越美国畜生! . 中国共产党很不容易的! 中国共产党万岁! 我们这代华人都是看着解放台湾全过程! 台湾人罪孽深重 ,解放台湾 铲平邪教! 台湾一解放!邪教法轮狗、邪教自焚轮子狗、64反华余孽、外逃在外靠反华活命的野狗都会死无葬身之地 。 . 海外华人都是亲眼见证中国一步步强大 统一台湾省! . 海外华人支持习近平! 海外华人支持中国政府所有的决策决定! . . .
福港
19 楼
中兴都7nm了,傻逼,你还窝在你妈逼里,啥也看不到?
江南游侠
20 楼
以中国的人口基数和工业基础,如果人均GDP超越美国那会多么恐怖的经济规模,所以经济总量超越美国,美国应该庆幸了。
j
jujubi
21 楼
: 中兴7n m是靠重复曝光达到的。成本上升,良率下降。傻逼! 况且最近日本也限制了20多项关键化工品出口,ASML限制了成熟制程技术。最后结果就是你死回你妈逼里。 [2评]
j
jujubi
22 楼
: 我还说你的主子是傻逼呢 [1评]
海之骄子
23 楼
放屁的专家,什么时候全中国老百姓平均生活水平达到美国人平均生活水平,中国才有能力超美。不然就是吹牛逼。
海之骄子
24 楼
支你妈那逼
吕德水
25 楼
按照目前国内的政治经济形式,GDP超美有啥用?少装逼为妙,不然把你发展中国家的名头去掉,就是鸡飞蛋打
海之骄子
26 楼
全中国男人支你妈那黑逼,简称支那。
海之骄子
27 楼
自己过自己的日子,成天喊口号吹牛逼,脑子有病。
福港
28 楼
日本限制了20多项关键化工品出口你妈阁逼吧,傻逼,等到限制了再来逼逼,最后结果就是你死回你妈逼里
福港
29 楼
你知道你妈为什么这么受欢迎吗?三眼同操,慰安还自愿,傻逼慰安妇的后代!
福港
30 楼
你们这些舔逼狗杂,即使死,也改不了吃屎,直接操你妈,就对了
m
michi1119
31 楼
樱桃儿熟了
32 楼
切!咱是星辰大海,有点出息。干嘛要和丑国比,或和毛里求斯比?再过5年,要么10年,超过丑国许多是肯定的了。
k
kkk8
33 楼
狗粮威武
m
maomaodog
34 楼
胡扯
给大爷笑一个
35 楼
霉菌战呼队的?
J
Jagaa
36 楼
回复【24楼】 jujubi: 你死在你妈的逼里,要不你叫jujubi?
k
kyogui
37 楼
可是中国的算力都是靠美国芯片实现的啊
小小铅笔刀
38 楼
别他妈扯淡了,和综合国力有毛关系,还是静下心来把芯片,动力发动机,医疗器械弄明白吧先
五十而立
39 楼
穿凿附会吧?我去餐厅吃个饭,买双鞋,买个房,这些产业 - 服务业,消费品销售,地产业,都是GDP里面的大头,跟算力有什么关系?
猎头军师
40 楼
洗洗睡吧。
猎头军师
41 楼
中国人均2W美金到顶了,相当于美国2-3倍的GDP。世界经济没这么大规模来支撑中国人均超美国
猎头军师
42 楼
靠堆量,算力建设也是基础设施建设的一部分,砸钱,低水平的重复建设,算总量
猎头军师
43 楼
中兴被老美盯着呢,有老美的人在公司内部监督,没可能科技突破了,卡的死死的。这公司以后也就是个用现成的解决方案整合整合而已了。
i
iphonel3
44 楼
/ / 天天被共产马列独裁专制洗脑,没有自由只有骂街的烂臭五毛监犯烂春袋进行的大模型训练,输入垃圾数据输出赤纳粹的语言,偷讹拐骗山寨全世界高科技,烂尾楼欠债累累青年失业21%,算力要超美,GDP人均要千亿美元。终于实现亩产万斤全民炼钢大跃进。 / /
M
Monalisa
45 楼
很好,就照這樣自信走下去!3030年一定可以看到歐美朋友的車尾燈