陆媒:华为的大模型终于来了 评价是 相当震撼

今日头条
Toutiao
最新回复:2023年7月7日 22点33分 PT
  返回列表
72350 阅读
40 评论
差评

老被人说在大模型竞赛中掉队的华为,这次终于带着它的家伙事儿来了。

这不,在昨天的华为开发者大会 2023 上,华为就狠狠地秀了一把。

将近三个小时的发布会,还是继承了华为以往大杂烩的风格,看得世超是眼花缭乱。

不过,总结下来其实也就突出了一个主题:盘古大模型 3.0 。

其实就在前几天,当别的大模型还在比各种评分的时候,盘古靠着世界顶级期刊 Nature 认证的金字招牌,以一种别具一格的方式进入了大家的视野。

据说,加入了盘古大模型,气象预测的速度提高了 10000 倍以上,几秒钟就能出结果,台风打哪来,几点来,啥时候走,都能给你预测得明明白白的。

最主要的是,它的预测精度甚至超过了号称全球最强的欧洲气象中心的 IFS 系统,算是头一个 AI 预测赢了传统数值预测的产品。

要知道,以往的 AI 气象预测多是基于 2D 神经网络开发,但气象这玩意实在是太复杂了,2D 着实有点儿吃不消。

而且,之前的 AI 模型会在预测的过程当中不断累计迭代的误差,容易影响到结果的精确性。

所以 AI 预测方法一直都不咋受待见。

而盘古气象大模型牛就牛在,他们用了个叫 3DEST 的三维神经网络来处理气象数据, 2D 干不了的那就换 3D 来。

3DEST 的网络训练和推理策略

针对迭代误差的问题,模型还用了个 “ 层次化时域聚合策略 ” 来减少迭代误差,从而提高预报的精度。

这词儿虽然听起来挺容易被唬住的,但其实很好理解。

就比如,之前的 AI 气象预测模型 FourCastNet ,在台风来之前,它会提前 6 小时进行预测,在这 6 个小时里,模型会多次计算台风到底啥时候来。

可能一会儿算出来 5 个小时,一会儿又算出来 4 个半小时,这些结果加到一起误差就大了。

但盘古气象大模型想了个法子,训练了 4 个不同预报间隔的模型,分别是 1 小时迭代 1 次,还有 3 小时、 6 小时和 24 小时迭代 1 次。

再根据具体的气象预测需求,选择相应的模型进行迭代。

就比如说,咱们如果要预测未来 7 天的天气,那就让 24 小时的模型迭代 7 次;预测 20 个小时就是 6 小时的模型迭代 3 次 +1 小时的迭代 2 次。

迭代次数越少,误差也就越小。

这波操作,让天气预报又迈向了一个新的 level 。

不过,可能有差友开始犯嘀咕了,人家的大模型都是生成图像和文字,怎么到华为这就变成了天气预报了?

有一说一啊,这盘古大模型跟咱之前接触到的 ChatGPT 、 Midjourney 的确不太一样,人家做的是行业的生意。

简单来理解,就是盘古大模型咱个人一般用不上。

它并不是大家期待的 ChatGPT“ 克星 ” ,而是针对平时不太能接触到的To B 市场。

咱先不提难与不难,至少华为这么多年积累下来的企业客户资源,确实很容易变现。

而且华为这次的发布会可不止带来了气象预测模型这一个狠角色。

40 多年都没发现新的抗生素,盘古药物分子大模型一来就找着了超级抗菌药 Drug X ,而且药物的研发周期从数年缩短至几个月,研发成本降低 70% 。

盘古矿山大模型也能深入到采煤的 1000 多个工序之中,而且光是里头挑选精煤的这一个环节,就能让精煤回收率提升 0.1% 到 0.2% 。

要知道,一家年产 1000 万吨焦煤的选煤厂,每提升 0.1% 精煤产率,每年就能多 1000 万的利润。

这可都是白花花的银子啊。。。

事实上,除了上边儿咱提到的天气预测、药物研发和选煤,盘古大模型在很多行业里都已经用起来了。

发布会上,华为云人工智能首席科学家田奇就表示,华为云人工智能项目已经应用在了超过 1000 个项目中,其中 30% 用在客户的核心生产系统里,平均推动客户盈利能力提升了 18% 。

而华为能够量产这些各不相同的行业大模型,要归功于华为盘古大模型 3.0 的 5+N+X 三层架构。

正是这种结构,让盘古能够快速落地到各个行业里。

为什这么说呢?

因为 AI 落地行业,数据是一大难点。

张平安在发布会上就说, “ 由于行业数据获取难,技术与行业结合难,大模型在行业的落地进展较慢。 ” 

而盘古则很巧妙,通过 5+N+X 的三层架构,直接把这个大难题拆成了 3 个小问题来解决。

首先,是先让盘古 L0 层的 5 个大模型,学习了上百 TB 的百科知识、文学作品、程序代码等文本数据,以及数 10 亿张带文本标签的互联网图像。

咱们可以理解为,先让第一层 L0 的大模型( 自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型这 5 个基础大模型 )建立起基本的认知,也就是有点像咱们大学前的素质教育阶段。

然后,在第二层 L1 中的模型,则是让 L0 中的某一个基础大模型学习 N 个相关行业的数据形成的。这就像大学的本科阶段,需要选择各种专业去学习。

打个比方,医院里的 CT 影像检测跟工厂的图像质检虽说用的都是视觉大模型。

但毕竟一个是医院,一个是工厂,使用场景完全不一样,光靠基础大模型那肯定行不通,但如果把行业数据加进去,可能就有惊喜了。

最后的 L2 ,则类似研究生,会在具体行业的基础上再细化到某个场景。比如在仓储物流行业里,货物的运输、入库、出库可能都需要用到不一样的部署模型。

与此同时呢,华为还在里头加入一个反馈环节,有点进公司实习内味了。

根据他们的说法,过去开发一个 GPT-3 规模的行业大模型,通常需要 5 个月;而有了这套东西,开发周期能缩短至原来的 1/5 。

同时很多行业数据集小的限制也能被解决。比如造大飞机这种很细很细的行业,也能有大模型。

除了这一套大模型,华为这次还提出了个非常有意思的东西——算力国产化。

众所周知,咱们在 AI 算力方面,确实是比较尴尬。

一来, AI 行业的核心设备英伟达的 H100/A100 咱们买不到,二来,即使英伟达 “ 贴心 ” 出了平替 H800 ,但是也有所保留。比如,在传输速率上就砍了不少。

在大模型动辄几个月训练时间的背景之下,这就很容易被算力更强的国外同行弯道超车。

而这一回,针对这个问题,华为还是掏了些真家伙出来的。

比如,在纸面性能上,华为的昇腾 910 处理器已经够上了英伟达 A100 。

不过实际应用起来,还是有一些差距的。而且 A100 这也不是英伟达的终极武器。

但是,昇腾已经受到了不少友商的认可。华为甚至在发布会上,直接表示 “ 中国一半大模型的算力都是由他们提供的 ” 。

当然,华为这会儿在算力上的亮点,更像是整个软件生态带来的。

比如,根据发布会的说法,算上 AI 昇腾云算力底座、计算框架 CANN 。。。等环节,华为在训练大模型方面,效率是业界主流 GPU 的 1.1 倍。

还有,他们给用户制定好了全套的应用套餐。

例如,美图仅用 30 天就将 70 个模型迁移到了华为生态。同时华为还表示,在双方的努力下,AI 性能较原有方案提升了 30% 。

还是挺可观的。

而且华为还说,他们现在有近 400 万的开发者,这个数量,是和英伟达 CUDA 生态对齐了。

这一系列的动作,算是把短板补上了一部分。

总的来说,一场华为发布会看下来,差评君觉得华为在 AI 方面的布局是很深刻的,他们早就开始思考 “AI 真正能带给我们什么 ” 这个问题了。

过去半年里, AI 行业虽然掌声雷动,但是真正落到行业层面,多少有些尴尬。

而华为的这一次动作,恰好印证了如任正非说的:

 “ 未来在 AI 大模型方面会风起云涌的,不只是微软一家。人工智能软件平台公司对人类社会的直接贡献可能不到 2% , 98% 都是对工业社会、农业社会的促进。 ” 

AI 领域,真正的大时代还在后头。

开心小黄人
1 楼
狗粮都是疯了吗?还中国是原罪。你们祖宗都是原罪,赶紧自杀赎罪去
阳光俊男
2 楼
养猪规模相当震撼。 [1评]
五谷不分
3 楼
华为这个离普通消费者比较遥远,没有chatgpt那种直观感受,属于具体领域的专业ai应用,是另一种发挥到极致的牛逼。 天气预测到了这个级别,下一步真的已经可以考虑开发气象武器了,在某时某刻某地,施加怎样的一个动作,通过ai判断出其带来的蝴蝶效应的结果。我靠,美帝吹的牛逼,又要被兔子实现了。 另外还有华为的ai算力硬件,这要感谢拜登的神助攻了,逼着英伟达自断财路,本来国内大厂用着英伟达的生态下的高端芯片好好的,一断供,没办法了,只能转移到华为的生态。英伟达绝对是哭晕在厕所。 [1评]
w
wmqjsgg
4 楼
继续忽悠 [1评]
W
WUSHINJ
5 楼
回复5楼: 你这个被王丹插过肛门的变态杂种,看到你这条猪🐷这么悲愤,就知道被戳到痛处了! 赶快回去操一下你妈,熟女败火,应该能缓解你悲愤的心情; 否则你会马上抽搐而死,亦或抑郁而亡!
W
WUSHINJ
6 楼
你爷爷把你妈忽悠上了床,结果就生出你这个杂种,所以你是个乱伦的杂种!
翻墙是犯法的
7 楼
都是应用层面。没看出大突破。
s
slimane
8 楼
強國很快連28納米芯片都生產不出來,繼續吹 [1评]
s
szacy
9 楼
無敵華為,不可阻擋,中國之福。
k
kake
10 楼
华为干得好 下一步就是找到空域时域热点,武器化
W
WUSHINJ
11 楼
倭孙杂种: 可以把你妈绑在火炉上,然后拖下她的裤子,你妈裤裆里贮藏了几十年的腥骚味对你这个杂种吹,就可以把你吹成28納米了,然后就齐活了!
m
mike3
12 楼
可预测什么时候吃包子最健康?
催你明白交粑粑
13 楼
华为猪养的怎么样了 [1评]
催你明白交粑粑
14 楼
这货五谷都尼玛不分还尼玛评论,华为用什么替代NVIDIA的产品?
W
WUSHINJ
15 楼
你这头公猪,还有你妈那头母猪🐷不是都养成可以交配的猪了吗? 你和你妈现在交配,就可以生出很多猪仔了!
C
Cuisiner
16 楼
华为的麒麟,鸿蒙,盘古,把宇宙带回起源
陈元龙
17 楼
那也不如你家两个老东西会养啊!哦,不对,它们养的是狗 LOL
B
Bccan
18 楼
支持华为
n
neophoenix
19 楼
华为这个走的是欧洲路线啊,感觉还在走精英垄断阴谋路线,最近世界不稳定的因素都在内了,不知道是不是一直在合作,感觉有点挑明了,暂时给差评啊 其中排名前三位的分别是Meta(21400)、欧洲超算Leonardo(13824)和特斯拉(7360),只不过彼时这三家公司/机构都没有将算力应用在生成式AI领域。例如Meta将算力给到了元宇宙业务上,欧洲超算Leonardo主要瞄准的是气候、航空航天和生物医药,特斯拉则是将算力用在了训练Autopilot与自动驾驶的深度神经网络。 https://www.6parknews.com/newspark/view.php?app=news&act=view&nid=606689
H
Holycow
20 楼
预测一下猪头什么时候下台
爸爸老爹
21 楼
牛逼! 感觉今年是AI元年,各个公司都把自己压箱底的产品公布出来了。
l
liebsh
22 楼
用的什么芯片,哪偷来的! [1评]
C
Cromwellgm
23 楼
华为:盘古我不想盘,我在线等你的:鸿蒙,6G,DT反屏手机,天才少年的创新。最心急的是在加拿大等孟晚舟回来和家人团聚…
a
anywho
24 楼
華為加油👏💪
a
anywho
25 楼
🧎‍♀️狗糧自己詐騙畜、想像別人也是! 狗糧的狗主掠奪阿富汗血汗錢73萬美元、現在烏克蘭零元購、 下次台巴、己經霉積電了
雁过留言机
26 楼
给大家说个笑话:当华为的鸿蒙操作系统从中文切换为英文立刻变成Android
J
Julianyfdr123
27 楼
没看懂吧?
出自网络
28 楼
养猪规模相当震撼。。。 ========================================================================================================================================= 不但养猪还挖矿呢,住下水道看大妓院果然鼠目寸光。
v
vesucks
29 楼
扯淡。气象武器还不如跳大神儿靠谱。
s
szacy
30 楼
傻逼弱智。
s
szacy
31 楼
华为连续传来了两个消息,一个令国外叹服,一个令国人欣慰! ​就在这两天,科技圈连续传来了两件大事。一件是,一向眼光高、专业性强的国际顶级期刊《自然》杂志,罕见的将目光聚焦到了中国技术创新上。在7月6日的《自然》正刊上,华为云盘古大模型研发团队独立研究并撰写的研究成果成功登顶。 ​不同于之前的联合研发,这是中国科技公司首篇作为唯一署名单位发表的《自然》正刊论文。《自然》审稿人对该成果给予高度评价:“华为云盘古气象大模型让人们重新审视气象预报模型的未来,模型的开放将推动该领域的发展。” ​盘古大模型实现了气象预报精度首次超过传统数值方法,速度提升了10000倍,能够提供秒级天气预报,像包括重力势、湿度、风速、温度,气压等变量的1小时-7天预测,盘古大模型都能准确的提供。更值得一提的是,目前欧洲中期预报中心以及欧洲多国气象部门,都已经在使用盘古大模型。 ​而另一件则是7月7日当天,#华为云正式发布盘古大模型3.0#。一来,该版本在芯片、算力、框架、平台、模型和工具链这六大层面,实现了全栈自主创新和技术领先。二来,在技术应用上,盘古大模型也在多个行业展开了超过1000个项目的应用。渗透了金融、政务、制造、矿山、铁路等各个行业。 ​也就是说,无论是在技术深度层面,还是产业应用层面,华为都走在了世界前列。这对于中国智能时代来说,无疑具备着重大意义。要知道,中国一直以来都憋着一口气。因工业起步晚,中国在很多核心技术上都受制于人。技术上的受制,也就意味着产业链的落后。更气愤的是,西方拿走了巨额的利润的同时,还不留余地的对中国科技进行全面封锁。
南方兔儿爷
32 楼
说的就是这个中国用人工智能用在科学环境和经济问题,国外现在就流行抢眼球从上到下剩张嘴ChatGpt就是,一瞬间好像人人感受到很大的噱头,但是几解决不了这种问题也不能解决粮食问题。
南方兔儿爷
33 楼
就算造不出来,农民几时播种几时上大棚是方便多了。国外可以继续用chatGpt帮改求职简历,帮写论文帮写代码和帮写TTP也不错。
s
szacy
34 楼
Thumbs up in salute, the invincible HW.
v
visible
35 楼
看你急的,如丧考妣
v
visible
36 楼
在nature上发文,有的人或脱队一辈子都做不到
c
coroner3164
37 楼
留园就需要您这种懂行且中立的留言者。 在一堆意识形态主导或者纯粹的骂街留言中,还能发现点知识。 请多讲讲。