达摩院成功研发存算一体AI芯片,突破冯·诺依曼架构性能瓶颈 (

H
Huangchong
楼主 (未名空间)

【 以下文字转载自 Military 讨论区 】
发信人: foofy (不才), 信区: Military
标 题: 达摩院成功研发存算一体AI芯片,突破冯·诺依曼架构性能瓶颈
发信站: BBS 未名空间站 (Fri Dec 3 01:59:54 2021, 美东)

达摩院成功研发存算一体AI芯片,突破冯·诺依曼架构性能瓶颈

集微网消息,12月3日,集微网获悉,达摩院成功研发新型架构芯片。该芯片是全球首
款基于DRAM的3D键合堆叠存算一体AI芯片,可突破冯·诺依曼架构的性能瓶颈,满足人工智能等场景对高带宽、高容量内存和极致算力的需求。在特定AI场景中,该芯片性能提升10倍以上,能效比提升高达300倍。

达摩院表示,过去70年,计算机一直遵循冯·诺依曼架构设计,运行时数据需要在处理器和内存之间来回传输。随着时代发展,这一工作模式面临较大挑战:在人工智能等高并发计算场景中,数据来回传输会产生巨大的功耗;目前内存系统的性能提升速度大幅落后于处理器的性能提升速度,有限的内存带宽无法保证数据高速传输。

冯·诺依曼和冯·诺依曼计算机

在摩尔定律逐渐放缓的背景下,存算一体成为解决计算机性能瓶颈的关键技术。存算一体芯片类似人脑,将数据存储单元和计算单元融合,可大幅减少数据搬运,从而极大地提高计算并行度和能效。这一技术早在上世纪90年代就被提出,但受限于技术的复杂度、高昂的设计成本以及应用场景的匮乏,过去几十年,业界对存算一体芯片的研究进展缓慢。

达摩院研发的存算一体芯片集成了多个创新型技术,是全球首款使用混合键合3D堆叠技术实现存算一体的芯片。该芯片内存单元采用异质集成嵌入式DRAM(SeDRAM),拥有超大带宽、超大容量等特点;计算单元方面,达摩院研发设计了流式的定制化加速器架构,对推荐系统进行“端到端”的加速,包括匹配、粗排序、神经网络计算、细排序等任务。

得益于整体架构的创新,该芯片同时实现了高性能和低系统功耗。在实际推荐系统应用中,相比传统CPU计算系统,存算一体芯片的性能提升10倍以上,能效提升超过300倍。该技术的研究成果已被芯片领域顶级会议ISSCC 2022收录,未来可应用于VR/AR、无人
驾驶、天文数据计算、遥感影像数据分析等场景。

达摩院计算技术实验室科学家郑宏忠表示:“存算一体是颠覆性的芯片技术,它天然拥有高性能、高带宽和高能效的优势,可以从底层架构上解决后摩尔定律时代的芯片性能和能耗问题,达摩院研发的芯片将这一技术与场景紧密结合,实现了内存、计算以及算法应用的完美融合。”

据悉,达摩院计算技术实验室专注研究芯片设计方法学和新型计算机体系结构技术,已拥有多项领先成果,在ISSCC、ISCA、MICRO、HPCA等顶级会议上发表多篇论文。

目前,整个行业对存算一体芯片技术的研究依旧处于探索阶段,在工艺成熟度、典型应用、生态系统等方面仍不成熟,达摩院希望逐步攻克技术难题,先研究基于三维堆叠的近存芯片,通过拉近存储单元与计算单元的距离、增加带宽,来降低数据搬运的代价,缓解由于数据搬运产生的瓶颈。未来,达摩院会进一步攻克存内计算技术。在应用方面,达摩院会和阿里内部业务紧密合作,未来逐步针对内部AI应用场景适配优化。
https://www.laoyaoba.com/n/800241

H
Huangchong


这个标题牛逼 字数恰到好处 在买买提app 主题列表上看就是

“达摩院成功研发存算一体AI芯片,突破冯·诺依曼架构”

等看到吵架了 再点进帖子仔细看 后面还有四个字:“性能瓶颈”

瓶颈细 细颈瓶 突破瓶颈 细颈瓶从此不再细瓶颈

【 在 Huangchong (净坛使者) 的大作中提到: 】
: 发信人: foofy (不才), 信区: Military
: 标 题: 达摩院成功研发存算一体AI芯片,突破冯·诺依曼架构性能瓶颈
: 发信站: BBS 未名空间站 (Fri Dec 3 01:59:54 2021, 美东)
: 达摩院成功研发存算一体AI芯片,突破冯·诺依曼架构性能瓶颈
: 集微网消息,12月3日,集微网获悉,达摩院成功研发新型架构芯片。该芯片是全球首
: 款基于DRAM的3D键合堆叠存算一体AI芯片,可突破冯·诺依曼架构的性能瓶颈,满足人
: 工智能等场景对高带宽、高容量内存和极致算力的需求。在特定AI场景中,该芯片性能
: 提升10倍以上,能效比提升高达300倍。
: 达摩院表示,过去70年,计算机一直遵循冯·诺依曼架构设计,运行时数据需要在处理
: 器和内存之间来回传输。随着时代发展,这一工作模式面临较大挑战:在人工智能等高
: ...................

H
Huangchong

要是能量产倒是不错

其实苹果M1那种就近封装cpu 我就挺想买的

【 在 Huangchong (净坛使者) 的大作中提到: 】
: 发信人: foofy (不才), 信区: Military
: 标 题: 达摩院成功研发存算一体AI芯片,突破冯·诺依曼架构性能瓶颈
: 发信站: BBS 未名空间站 (Fri Dec 3 01:59:54 2021, 美东)
: 达摩院成功研发存算一体AI芯片,突破冯·诺依曼架构性能瓶颈
: 集微网消息,12月3日,集微网获悉,达摩院成功研发新型架构芯片。该芯片是全球首
: 款基于DRAM的3D键合堆叠存算一体AI芯片,可突破冯·诺依曼架构的性能瓶颈,满足人
: 工智能等场景对高带宽、高容量内存和极致算力的需求。在特定AI场景中,该芯片性能
: 提升10倍以上,能效比提升高达300倍。
: 达摩院表示,过去70年,计算机一直遵循冯·诺依曼架构设计,运行时数据需要在处理
: 器和内存之间来回传输。随着时代发展,这一工作模式面临较大挑战:在人工智能等高
: ...................

d
dakedo

不要买M1
只能外接一个显示器

【 在 Huangchong (净坛使者) 的大作中提到: 】
: 要是能量产倒是不错
: 其实苹果M1那种就近封装cpu 我就挺想买的

H
Huangchong

是被显卡限制了吗?

【 在 dakedo (大蝌蚪) 的大作中提到: 】
: 不要买M1
: 只能外接一个显示器

H
Huangchong

我觉得这种就近封装 可能会形成趋势吧 笔记本不用说了 就算台式机 性能提升
应该也是比较显著的

【 在 dakedo (大蝌蚪) 的大作中提到: 】
: 不要买M1
: 只能外接一个显示器

p
pinfish

显卡带宽不够吧
降降分辨率都不行?
【 在 dakedo (大蝌蚪) 的大作中提到: 】
: 不要买M1
: 只能外接一个显示器

z
zeami

第二个显示器难道不是干扰自己的?
当然,叔并不用M1,不是傻饭

【 在 pinfish (小刺鱼) 的大作中提到: 】
: 显卡带宽不够吧
: 降降分辨率都不行?

p
pinfish

属实
现在干活一个49刚刚好
【 在 zeami (贼阿米) 的大作中提到: 】
: 第二个显示器难道不是干扰自己的?
: 当然,叔并不用M1,不是傻饭

z
zeami

呃。我用两个,工地24,家里23.6。加起来也没49。。。

【 在 pinfish (小刺鱼) 的大作中提到: 】
: 属实
: 现在干活一个49刚刚好

z
zeami

工地一个小朋友用三只24,加起来也没有49

【 在 zeami (贼阿米) 的大作中提到: 】
: 呃。我用两个,工地24,家里23.6。加起来也没49。。。

p
pinfish

两个27=49带鱼
【 在 zeami (贼阿米) 的大作中提到: 】
: 呃。我用两个,工地24,家里23.6。加起来也没49。。。

z
zeami

带鱼咋理解

【 在 pinfish (小刺鱼) 的大作中提到: 】
: 两个27=49带鱼

H
Huangchong

很宽的长条

【 在 zeami (贼阿米) 的大作中提到: 】
: 带鱼咋理解

H
Huangchong

我觉得两个屏幕并排还是有好处的
比如有的屏幕可以转 而有些东西竖起来看比较方便

【 在 Huangchong (净坛使者) 的大作中提到: 】
: 很宽的长条

z
zeami

单个显示屏也可以竖起来看

【 在 Huangchong (净坛使者) 的大作中提到: 】
: 我觉得两个屏幕并排还是有好处的
: 比如有的屏幕可以转 而有些东西竖起来看比较方便

p
pinfish

麻烦,需要竖的就再加一个,或者正常比例的38之类
最近考虑入个dell的 8k
【 在 Huangchong (净坛使者) 的大作中提到: 】
: 我觉得两个屏幕并排还是有好处的
: 比如有的屏幕可以转 而有些东西竖起来看比较方便