近期,英伟达在芯片领域遭遇了一系列挑战,包括B200/GB200芯片的交付延迟以及B300/GB300新芯片的难产问题。以下是对这一情况的详细分析说明:
技术参数升级与功耗挑战
据Wccftech报道,英伟达即将推出的B300/GB300旗舰芯片在技术上进行了显著升级。B300的显存规格从192Gb提升至288Gb,而GB300平台则采用了LPCAMM内存模块设计,并配备了带宽高达1.6Tbps的光模块,以实现数据的高速传输。这些升级带来了性能的大幅提升,但同时也导致了功耗的急剧增加。B300/GB300的TDP(热设计功耗)高达1400W,相较于Hopper架构的H100芯片350W的TDP,这一数字显得异常惊人。对于服务器的散热设计来说,这无疑是一个巨大的挑战。
过热问题与量产风险
天风国际分析师郭明錤在其研报中提到,英伟达在为B300/GB300芯片开发测试DrMos技术时遇到了过热问题,这可能会影响到芯片的量产进度。DrMos技术是英特尔在2004年推出的一种集成驱动器和MOS的技术,旨在减小元件空间占用并降低寄生参数的负面影响,从而提升转换效率和功率密度。这种技术在消费级显卡RTX3060上已得到应用,由AOS供应,并在英伟达Hooper架构芯片上由MPS供应。英伟达此次在Blackwell架构芯片上测试AOS的DrMos方案,尽管AOS的方案在行业内得到了广泛验证,但仍存在过热问题。
设计缺陷与责任归属
郭明錤的财报中还提到,B300的发热问题不仅仅源于DrMos芯片本身,还与系统芯片管理的设计不足有关。这已经不是Blackwell第一次被曝出存在设计问题。今年8月,《TheInformation》报道了B200在台积电流片过程中发现的设计缺陷。最初,这被认为是台积电N4P制程工艺的问题,但英伟达CEO黄仁勋后来明确指出,问题是由于GPU芯片、LSI桥、RDL中介层和主板基板之间的热膨胀特性不匹配,导致封装结构出现弯曲。这意味着责任完全在英伟达。
交付延迟与优先权问题
由于芯片设计被曝出缺陷,B200/GB200芯片的交付时间从今年第三季度被推迟至第四季度。目前,没有公司拿到B200芯片。马斯克领导的xAI凭借10.8亿美元的订单获得了B200芯片的优先交付权,这些芯片将用于增强xAI的超级计算集群Colossus。即便如此,xAI也要等到明年1月份才能收到B200芯片。
Blackwell架构的挑战
英伟达原定于明年3月在GTC大会上发布B300芯片,但现在面临未发布先难产的问题。英伟达在Blackwell架构上一再出现问题,一个重要原因是英伟达过于追求芯片性能上的断代领先,导致Blackwell系列芯片几乎变成了一个实验性平台。例如,CoWoS-L封装技术的应用。Blackwell是基于MCM(多芯片封装)设计的GPU,集成两颗GPUdie,台积电首次将CoWoS-L技术应用于这种封装。
英伟达在技术上的激进追求与量产型产品的需要之间存在矛盾,这导致了Blackwell架构芯片在设计和生产上的一系列问题。这些问题不仅影响了芯片的按时交付,还可能对英伟达在AI服务器芯片市场的领先地位构成威胁。
本文来自作者[sxkxdz]投稿,不代表快芯号立场,如若转载,请注明出处:https://vip.sxkxdz.com/zixue/202412-119760.html
评论列表(4条)
我是快芯号的签约作者“sxkxdz”!
希望本篇文章《英伟达新王炸芯片遭遇困境 市场期待落空 难产之谜引发广泛讨论 (英伟达新功能)》能对你有所帮助!
本站[快芯号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览:近期,英伟达在芯片领域遭遇了一系列挑战,包括B200,GB200芯片的交付延迟以及B300,GB300新芯片的难产问题,以下是对这一情况的详细分析说明,技术参数升级与功耗挑战据...