女大的发热问题在1个月前就传开了。最大客户微软为此把很多BLACKWELL NVL72 ORDER 取消了。
GB200-NVL72 接口合格率很低,加上MOS 电源芯片发热导致合格率比较低。这2个关键部件居然都只有单一供货源。。以前做产品任何关键部件/Subsystem至少2个供货商 get Qualified,只有一个供货商是不可以进入MASS PRODUCTION的。可见女大内部产品开发工程设计,质量控制,风险控制有问题, 。不知道女大的设计原则是几个SIGMA的。看样子为了赶进度很多该做的ENGINEERING VERIFICATION/Reliabity Design没做好,SIGMA不高吧。
绝大部分客户订的是NVL72大机柜,据说现在出问题的就是这个配套。。DELAY是基本确定的。女大也许可以发货GB200 NVL36的,可是别人都要GB200 NVL72的。。
女大BLACKWELL问题不是简单的女大问题,希望它能尽快解决发热问题,并吸取教训,在RUBIN 时避免出现这样的情况。
女大的发热问题在1个月前就传开了。最大客户微软为此把很多BLACKWELL NVL72 ORDER 取消了。
GB200-NVL72 接口合格率很低,加上MOS 电源芯片发热导致合格率比较低。这2个关键部件居然都只有单一供货源。。以前做产品任何关键部件/Subsystem至少2个供货商 get Qualified,只有一个供货商是不可以进入MASS PRODUCTION的。可见女大内部产品开发工程设计,质量控制,风险控制有问题, 。不知道女大的设计原则是几个SIGMA的。看样子为了赶进度很多该做的ENGINEERING VERIFICATION/Reliabity Design没做好,SIGMA不高吧。
绝大部分客户订的是NVL72大机柜,据说现在出问题的就是这个配套。。DELAY是基本确定的。女大也许可以发货GB200 NVL36的,可是别人都要GB200 NVL72的。。
女大BLACKWELL问题不是简单的女大问题,希望它能尽快解决发热问题,并吸取教训,在RUBIN 时避免出现这样的情况。