作者 | 荣智慧
编辑 | 向 现
唯物的中国芯片产业深度观察
6月26日,龙芯中科发布了基于国产自主指令集“龙架构”研发的服务器处理器龙芯3C6000系列芯片。
3C6000芯片有三个重要特征,一是To B,整体性能对标英特尔上一代至强系列;二是百分之百全供应链自主研发,确保关键领域应用安全;三是生产线良率超70%。
龙芯中科是“国家队”,区别于华为等“企业队”,其诞生与进步是国家科技战略的一部分,计划也曾因种种波折差点“流产”。
龙芯3C6000系列芯片
20多年,来路荆棘。采用MIPS架构的龙芯一号新闻刊登在《电脑报》上;“汉芯造假”给自主CPU蒙上阴影;靠“堆核”硬杠国外主流产品;直到“纯血”龙芯完全自研。
中美科技竞争,中国拿到的开局不利,但用空间换时间、用算法换制程、用多核堆叠换先进架构……在差距中追赶,终有达到世界领先的一天。
筚路蓝缕
龙芯的创业史绝不是一帆风顺。
2001年,龙芯中科还没有“中科”,龙芯只是中科院计算技术研究所的一个课题组,承担的任务是研发自主CPU。一年多的时间,龙芯1号流片成功,开创中国自主CPU的先河。又隔一年多,2003年,龙芯2号发布。
2009年,龙芯3号诞生。今年6月26日发布的3C6000,就是龙芯3号中3C线上的最新产品。
龙芯3号/图源:人民日报
问题来了。从龙芯1号到龙芯2号,仅用了一年多;为什么从龙芯2号到龙芯3号,隔了六年多?
幕后历程饱含艰辛。龙芯课题组研发的CPU,必须要通过科技部验收。验收无误,才能拿到下一步的经费。在龙芯2号研发过程中,“十五计划”中863计划资助的2C型号,没有达到SPEC CPU2000(下一代行业标准CPU密集型基准测试套件)的分值目标。
2006年,清华校内BBS的帖子《触目惊心的汉芯黑幕》,匿名举报汉芯CPU造假,举国震惊。经过调查,项目被证实造假:汉芯团队负责人购买摩托罗拉芯片、雇人磨去原厂商标、刻上“汉芯”字样,骗取国家上亿元科研经费。
由此,中国自主CPU项目受到广泛质疑。先是龙芯2号的2C型号性能不佳,加上舆论怀疑倍起,龙芯课题组负责人胡伟武硬着头皮接下了龙芯2号的2E计划,在“比较勉强”的情况下通过验收。
“比较勉强”的意思是,由于硬件性能有限,还是靠后期大量的程序编译、优化,一定程度上弥补了硬件设计的不足,完成了国家制定的指标。
胡伟武在进行CPU主板信号测试/图源:新华社
对于自主研发CPU,科技部给了一颗“定心丸”。时任科技部部长徐冠华公开表示,龙芯2E的成功表明,中国“十五”期间安排的自主CPU计划是成功的。这为“十一五”继续支持自主CPU项目奠定了基础。
当时的国际形势和今日不同,中国自主研发CPU并不存在“志在必得”的紧迫性,因此也非常看重对成果和指标的考量——如果花了太多钱,又做不出什么东西,多半还是要放弃的。
好在龙芯没有被放弃。
龙芯2E流片的同时,胡伟武带领团队开启了龙芯3号的规划。但是,“十一五”中支持自主CPU的“核高基”计划迟迟没启动。“核高基”即“核心电子器件、高端通用芯片及基础软件产品”,是2006年1月国务院发布的《国家中长期科学和技术发展规划纲要(2006—2020年)》确定的16个科技重大专项之一。
胡伟武/图源:北京日报
计划没启动,龙芯3号就没有钱。中科院预支了500万元,让龙芯3号先拿去花。后来,科技部得知龙芯3号的第一个型号3A1000基本完成设计后,又从“十五”的863计划内紧急划拨了2000万元。
2500万元,对于研发CPU来说,远远不够。“核高基”没启动,中科院计算所就自己掏钱支持龙芯项目。时任中科院计算所长李国杰院士,在一次会议上公开点名胡伟武:“你不能以任何经费理由放缓龙芯3号的研发”。计算所就是砸锅卖铁,也要支持龙芯。
随后,计算所设立了一个经费没有封顶的课题支援龙芯。2009年,龙芯3A1000流片。2010年,“核高基”的经费才到账,此时,计算所已经预支给龙芯七八千万元了。
没有中科院计算所的大力支持,龙芯项目不可能走到今天,那么也就没有“自主可控”CPU这一说了。
一波三折
龙芯3A1000作为中国第一个4核CPU芯片,为后续的技术发展提供了大量的原始积淀。今天3C6000上的片内互联、缓存一致性等技术,都是在3A1000上摸索出来的经验。
3B立项,立刻得到“核高基”专项支持。龙芯课题组转型为“龙芯中科”,开始企业化运营。然而,企业化运营又是一波三折。
龙芯本来是承担国家任务的课题研究小组,属于学院派,没有企业经营的经验,在管理过程中,出现了一些失误。其中一个战略失误,是研发3B时过于重视多核CPU架构,忽视了单核性能提升。
龙芯通用芯片发展路线/图源:龙芯中科
当时国际上CPU的发展趋势以多核为主,龙芯中科决定跟国际企业比拼多核设计。2006年发布的2E,性能跟主流的X86处理器只差一到两倍,然而,到了2013年的3B,性能比2E只提高了50%,而主流的X86处理器性能已经翻了五倍。
龙芯的核数一度比国外企业的还多,因为单核性能实在拖后腿,只好拼数量。单核性能是CPU通用处理性能的基础,单核做不好,直接后果就是产品在基础场景下不占优势——芯片没人要。
3B失利,“核高基”转而引进国外CPU技术,通过企业合资、技术授权来带动国产CPU发展。如今世面上不少国产CPU产品,都是从2013年“核高基”的支持下走出来的,大多基于国外技术架构。
龙芯受到极大打击,这样一来,自主CPU走不下去了。同样,在计算机操作系统、数据库等领域,合作而不是自主研发占上风的情况都有发生——那时毕竟没有什么科技战、贸易战,没有哪家企业进“白宫严选”,“纯血”国产的压力不大。
龙芯3A3000/图源:龙芯中科
负责人胡伟武痛定思痛,2013年暂停3C系列的16核CPU讨论,掉头“往回走”,专注提升4核设计的3A和3B的单核性能,经过三年攻关,3A3000流片成功,这款芯片的性能追平了当时X86和ARM的低端服务器CPU。
最关键的是,3A3000超过了靠技术引进打造出来的国内同类产品,成功为自主CPU挽回了生存机遇。正是龙芯团队的不懈努力,才能换来今天真正自主可控的CPU,成为科技战的“保底”项目之一。
龙芯3号系列,3A是4核,3B有4核和8核,3C是16核。3C早期型号是3C5000,3C6000在单核性能上又有了大幅提升。
可以说,3C6000在多核设计的基础上,补足了此前单核性能较弱的短板,是龙芯系列的里程碑产品。
自主可控
3C6000的“里程碑”与“自主可控”,到底体现在什么地方?
CPU的核心在于指令集架构,独立的指令集架构定义独立的软硬件生态。CPU硬件架构以指令集为标尺,一个CPU性能上限也是由指令集架构决定的。因此,只有指令集是自己的,CPU才真正是“自己的”。
龙芯在近20年的时间里,用的都是第三方架构——MIPS。MIPS和ARM一样,也是RISC指令集(精简指令集),但是,随着ARM在移动端广泛应用,RISC-V开源指令集火爆,MIPS的影响力江河日下。
胡伟武发表《自主CPU发展道路》的主旨演讲/图源:龙芯中科
不少游戏掌机玩家还记得MIPS架构的PSP模拟器,流畅度远超当年的高主频手机。然而,辉煌过后,MIPS已经成了“时代的眼泪”。
2020年,龙芯不再使用MIPS,首次推出自主设计的龙架构,3A5000是第一款支持龙架构的龙芯CPU。从这个节点开始,龙芯已经实现指令集、微架构、芯片设计的全面自研。
龙架构也是一个RISC指令集,包括大约2000条指令,其中除了基础指令,还有向量指令,虚拟化和二进制翻译等拓展指令。向量指令主要支持矩阵运算、卷积运算等等,可以用来进行高性能运算、AI计算。虚拟化是从指令集层面支持虚拟机。二进制翻译可以将X86和ARM指令集在硬件层面“翻译”为龙架构的指令集,部分解决软件的兼容问题。
不过,虽然硬件自研达成,但短期内生态很难提升。龙芯一直在构建社区,拉着国际、国内企业做联合开发。龙架构也支持Linux内核和一些编译器软件,以及统信、麒麟、龙蜥、开源鸿蒙等系统。
龙芯生态/截图自龙芯中科
目前来看,龙芯在消费级市场还不具备什么竞争力,由于其自主性和安全性的特征,在政务、电信、能源板块占据主导地位。工控、存储、智算等领域,龙芯都有自己的产品线。
龙芯指令集自研的情况下,其他IP也都是自研的。包括CPU核LA664,GPU核LG200,高速接口IP,存储接口IP等。
这也是龙芯和华为鲲鹏的一个重要区别。华为鲲鹏基于ARM架构,有些IP可以用第三方;龙芯用自己的指令集,所有的东西都要自己做——总之在“自主可控”上,绝对是没得挑的。
而最新产品3C6000的水平,根据官方援引的第三方测试结果,单硅片16核3C6000/S相当于英特尔16核至强Silver4314;双硅片32核3C6000/D相当于英特尔32核至强Gold6338;四硅片64核3C6000/Q超越了英特尔40核至强Platinum8380。
以上三款英特尔产品,都是2021年发布的服务器芯片,按出货量算,它们是2023、2024年的主流产品。可以说,龙芯3C6000对标的是上一代英特尔主流产品,和英特尔只差了一代,大概有4年左右的差距。
龙架构生态成果展示区/图源:龙芯中科
另外,3C6000与英特尔还有一个显著差别。
3C6000主打16核,核数再往上走,就得靠拼接——龙链,类似于英伟达的Nvlink,是一种高速片间互联技术。而英特尔都是单硅片设计。
这个差异取决于两方面,一是龙芯为保证良率,考虑到成本和风险,靠拼接更稳妥;二是英特尔作为国际巨头,高密度互联、缓存一致性等方面都有较大优势,龙芯还有追赶的空间。
总而言之,龙芯3C6000作为100%“纯血”国产芯片,为中国自主CPU争取了宝贵的市场地位,也带来了宝贵的信念信心。
6月26日龙芯中科产品发布会起了这样的名字“今日长缨在手”。这句诗引自毛泽东的《清平乐·六盘山》,下一句豪情万丈,“何时缚住苍龙?”
文中配图部分来源于网络
作者 | 荣智慧
编辑 | 向 现
唯物的中国芯片产业深度观察
6月26日,龙芯中科发布了基于国产自主指令集“龙架构”研发的服务器处理器龙芯3C6000系列芯片。
3C6000芯片有三个重要特征,一是To B,整体性能对标英特尔上一代至强系列;二是百分之百全供应链自主研发,确保关键领域应用安全;三是生产线良率超70%。
龙芯中科是“国家队”,区别于华为等“企业队”,其诞生与进步是国家科技战略的一部分,计划也曾因种种波折差点“流产”。
龙芯3C6000系列芯片
20多年,来路荆棘。采用MIPS架构的龙芯一号新闻刊登在《电脑报》上;“汉芯造假”给自主CPU蒙上阴影;靠“堆核”硬杠国外主流产品;直到“纯血”龙芯完全自研。
中美科技竞争,中国拿到的开局不利,但用空间换时间、用算法换制程、用多核堆叠换先进架构……在差距中追赶,终有达到世界领先的一天。
筚路蓝缕
龙芯的创业史绝不是一帆风顺。
2001年,龙芯中科还没有“中科”,龙芯只是中科院计算技术研究所的一个课题组,承担的任务是研发自主CPU。一年多的时间,龙芯1号流片成功,开创中国自主CPU的先河。又隔一年多,2003年,龙芯2号发布。
2009年,龙芯3号诞生。今年6月26日发布的3C6000,就是龙芯3号中3C线上的最新产品。
龙芯3号/图源:人民日报
问题来了。从龙芯1号到龙芯2号,仅用了一年多;为什么从龙芯2号到龙芯3号,隔了六年多?
幕后历程饱含艰辛。龙芯课题组研发的CPU,必须要通过科技部验收。验收无误,才能拿到下一步的经费。在龙芯2号研发过程中,“十五计划”中863计划资助的2C型号,没有达到SPEC CPU2000(下一代行业标准CPU密集型基准测试套件)的分值目标。
2006年,清华校内BBS的帖子《触目惊心的汉芯黑幕》,匿名举报汉芯CPU造假,举国震惊。经过调查,项目被证实造假:汉芯团队负责人购买摩托罗拉芯片、雇人磨去原厂商标、刻上“汉芯”字样,骗取国家上亿元科研经费。
由此,中国自主CPU项目受到广泛质疑。先是龙芯2号的2C型号性能不佳,加上舆论怀疑倍起,龙芯课题组负责人胡伟武硬着头皮接下了龙芯2号的2E计划,在“比较勉强”的情况下通过验收。
“比较勉强”的意思是,由于硬件性能有限,还是靠后期大量的程序编译、优化,一定程度上弥补了硬件设计的不足,完成了国家制定的指标。
胡伟武在进行CPU主板信号测试/图源:新华社
对于自主研发CPU,科技部给了一颗“定心丸”。时任科技部部长徐冠华公开表示,龙芯2E的成功表明,中国“十五”期间安排的自主CPU计划是成功的。这为“十一五”继续支持自主CPU项目奠定了基础。
当时的国际形势和今日不同,中国自主研发CPU并不存在“志在必得”的紧迫性,因此也非常看重对成果和指标的考量——如果花了太多钱,又做不出什么东西,多半还是要放弃的。
好在龙芯没有被放弃。
龙芯2E流片的同时,胡伟武带领团队开启了龙芯3号的规划。但是,“十一五”中支持自主CPU的“核高基”计划迟迟没启动。“核高基”即“核心电子器件、高端通用芯片及基础软件产品”,是2006年1月国务院发布的《国家中长期科学和技术发展规划纲要(2006—2020年)》确定的16个科技重大专项之一。
胡伟武/图源:北京日报
计划没启动,龙芯3号就没有钱。中科院预支了500万元,让龙芯3号先拿去花。后来,科技部得知龙芯3号的第一个型号3A1000基本完成设计后,又从“十五”的863计划内紧急划拨了2000万元。
2500万元,对于研发CPU来说,远远不够。“核高基”没启动,中科院计算所就自己掏钱支持龙芯项目。时任中科院计算所长李国杰院士,在一次会议上公开点名胡伟武:“你不能以任何经费理由放缓龙芯3号的研发”。计算所就是砸锅卖铁,也要支持龙芯。
随后,计算所设立了一个经费没有封顶的课题支援龙芯。2009年,龙芯3A1000流片。2010年,“核高基”的经费才到账,此时,计算所已经预支给龙芯七八千万元了。
没有中科院计算所的大力支持,龙芯项目不可能走到今天,那么也就没有“自主可控”CPU这一说了。
一波三折
龙芯3A1000作为中国第一个4核CPU芯片,为后续的技术发展提供了大量的原始积淀。今天3C6000上的片内互联、缓存一致性等技术,都是在3A1000上摸索出来的经验。
3B立项,立刻得到“核高基”专项支持。龙芯课题组转型为“龙芯中科”,开始企业化运营。然而,企业化运营又是一波三折。
龙芯本来是承担国家任务的课题研究小组,属于学院派,没有企业经营的经验,在管理过程中,出现了一些失误。其中一个战略失误,是研发3B时过于重视多核CPU架构,忽视了单核性能提升。
龙芯通用芯片发展路线/图源:龙芯中科
当时国际上CPU的发展趋势以多核为主,龙芯中科决定跟国际企业比拼多核设计。2006年发布的2E,性能跟主流的X86处理器只差一到两倍,然而,到了2013年的3B,性能比2E只提高了50%,而主流的X86处理器性能已经翻了五倍。
龙芯的核数一度比国外企业的还多,因为单核性能实在拖后腿,只好拼数量。单核性能是CPU通用处理性能的基础,单核做不好,直接后果就是产品在基础场景下不占优势——芯片没人要。
3B失利,“核高基”转而引进国外CPU技术,通过企业合资、技术授权来带动国产CPU发展。如今世面上不少国产CPU产品,都是从2013年“核高基”的支持下走出来的,大多基于国外技术架构。
龙芯受到极大打击,这样一来,自主CPU走不下去了。同样,在计算机操作系统、数据库等领域,合作而不是自主研发占上风的情况都有发生——那时毕竟没有什么科技战、贸易战,没有哪家企业进“白宫严选”,“纯血”国产的压力不大。
龙芯3A3000/图源:龙芯中科
负责人胡伟武痛定思痛,2013年暂停3C系列的16核CPU讨论,掉头“往回走”,专注提升4核设计的3A和3B的单核性能,经过三年攻关,3A3000流片成功,这款芯片的性能追平了当时X86和ARM的低端服务器CPU。
最关键的是,3A3000超过了靠技术引进打造出来的国内同类产品,成功为自主CPU挽回了生存机遇。正是龙芯团队的不懈努力,才能换来今天真正自主可控的CPU,成为科技战的“保底”项目之一。
龙芯3号系列,3A是4核,3B有4核和8核,3C是16核。3C早期型号是3C5000,3C6000在单核性能上又有了大幅提升。
可以说,3C6000在多核设计的基础上,补足了此前单核性能较弱的短板,是龙芯系列的里程碑产品。
自主可控
3C6000的“里程碑”与“自主可控”,到底体现在什么地方?
CPU的核心在于指令集架构,独立的指令集架构定义独立的软硬件生态。CPU硬件架构以指令集为标尺,一个CPU性能上限也是由指令集架构决定的。因此,只有指令集是自己的,CPU才真正是“自己的”。
龙芯在近20年的时间里,用的都是第三方架构——MIPS。MIPS和ARM一样,也是RISC指令集(精简指令集),但是,随着ARM在移动端广泛应用,RISC-V开源指令集火爆,MIPS的影响力江河日下。
胡伟武发表《自主CPU发展道路》的主旨演讲/图源:龙芯中科
不少游戏掌机玩家还记得MIPS架构的PSP模拟器,流畅度远超当年的高主频手机。然而,辉煌过后,MIPS已经成了“时代的眼泪”。
2020年,龙芯不再使用MIPS,首次推出自主设计的龙架构,3A5000是第一款支持龙架构的龙芯CPU。从这个节点开始,龙芯已经实现指令集、微架构、芯片设计的全面自研。
龙架构也是一个RISC指令集,包括大约2000条指令,其中除了基础指令,还有向量指令,虚拟化和二进制翻译等拓展指令。向量指令主要支持矩阵运算、卷积运算等等,可以用来进行高性能运算、AI计算。虚拟化是从指令集层面支持虚拟机。二进制翻译可以将X86和ARM指令集在硬件层面“翻译”为龙架构的指令集,部分解决软件的兼容问题。
不过,虽然硬件自研达成,但短期内生态很难提升。龙芯一直在构建社区,拉着国际、国内企业做联合开发。龙架构也支持Linux内核和一些编译器软件,以及统信、麒麟、龙蜥、开源鸿蒙等系统。
龙芯生态/截图自龙芯中科
目前来看,龙芯在消费级市场还不具备什么竞争力,由于其自主性和安全性的特征,在政务、电信、能源板块占据主导地位。工控、存储、智算等领域,龙芯都有自己的产品线。
龙芯指令集自研的情况下,其他IP也都是自研的。包括CPU核LA664,GPU核LG200,高速接口IP,存储接口IP等。
这也是龙芯和华为鲲鹏的一个重要区别。华为鲲鹏基于ARM架构,有些IP可以用第三方;龙芯用自己的指令集,所有的东西都要自己做——总之在“自主可控”上,绝对是没得挑的。
而最新产品3C6000的水平,根据官方援引的第三方测试结果,单硅片16核3C6000/S相当于英特尔16核至强Silver4314;双硅片32核3C6000/D相当于英特尔32核至强Gold6338;四硅片64核3C6000/Q超越了英特尔40核至强Platinum8380。
以上三款英特尔产品,都是2021年发布的服务器芯片,按出货量算,它们是2023、2024年的主流产品。可以说,龙芯3C6000对标的是上一代英特尔主流产品,和英特尔只差了一代,大概有4年左右的差距。
龙架构生态成果展示区/图源:龙芯中科
另外,3C6000与英特尔还有一个显著差别。
3C6000主打16核,核数再往上走,就得靠拼接——龙链,类似于英伟达的Nvlink,是一种高速片间互联技术。而英特尔都是单硅片设计。
这个差异取决于两方面,一是龙芯为保证良率,考虑到成本和风险,靠拼接更稳妥;二是英特尔作为国际巨头,高密度互联、缓存一致性等方面都有较大优势,龙芯还有追赶的空间。
总而言之,龙芯3C6000作为100%“纯血”国产芯片,为中国自主CPU争取了宝贵的市场地位,也带来了宝贵的信念信心。
6月26日龙芯中科产品发布会起了这样的名字“今日长缨在手”。这句诗引自毛泽东的《清平乐·六盘山》,下一句豪情万丈,“何时缚住苍龙?”
文中配图部分来源于网络