英伟达最新旗舰芯片B300/GB300的问题与挑战分析
一、背景与概述
英伟达在芯片市场的领先地位面临着严峻的考验。继B200/GB200芯片交付推迟后,新一代旗舰芯片B300/GB300的开发进程中出现了难题。据Wccftech于12月24日的报道,英伟达B300/GB300芯片的参数已经确认,其显存规格、内存模块设计和光模块带宽均有所提升。性能的显著提高伴随着功耗的大幅增加,B300/GB300的TDP(热设计功耗)达到了1400W,远超Hopper架构旗舰产品H100芯片的350W。这一功耗的增加为服务器的散热设计带来了巨大挑战。
二、技术参数与性能提升
B300芯片的显存规格从上一代的192Gb提升至288Gb,显示了其性能的显著提升。GB300平台引入了LPCAMM内存模块设计,并配备了带宽达到1.6Tbps的光模块,以支持高速数据传输。这些技术的改进预示着B300/GB300在性能上的飞跃,但同时也带来了功耗控制的难题。
三、功耗与散热问题
功耗的急剧增加对服务器的散热设计提出了更高的要求。天风国际分析师郭明錤在其研报中提到,英伟达在为B300/GB300开发测试DrMos技术时,发现了芯片的严重过热问题,这可能影响到B300/GB300的量产进度。DrMos技术是一种集成驱动器和MOS的电源解决方案,旨在减少元件空间占用并降低寄生参数影响,提升转换效率和功率密度。
四、DrMos技术问题
英伟达在Hooper架构芯片上使用的DrMos方案由MPS供应,而在Blackwell架构上则开始测试AOS的5*5DrMos方案。尽管AOS的DrMos方案在行业内已经得到广泛验证,但产业链人士指出,B300的发热问题不仅源于DrMos芯片本身,还与系统芯片管理的设计不足有关。
五、Blackwell架构的设计问题
Blackwell架构的B200在台积电流片过程中发现设计缺陷,这并非Blackwell首次出现设计问题。黄仁勋曾明确表示,GPU芯片、LSI桥、RDL中介层和主板基板之间的热膨胀特性不匹配导致封装结构出现弯曲,问题在于英伟达。B200/GB200芯片的交付时间因此被推迟至4季度,而目前尚无公司拿到B200芯片,马斯克凭借10.8亿美元的订单获得了B200芯片的优先交付权。
六、B300芯片的未来
B300芯片原定于明年3月GTC大会上发布,但现在面临未发布先难产的问题。英伟达在Blackwell架构上一再出现问题的一个原因是过于追求性能上的断代领先,导致Blackwell系列芯片几乎成为一个实验性平台。例如,Blackwell是一枚基于MCM设计的GPU,集成两颗GPU die,并首次应用台积电的CoWoS-L封装技术。
七、总结
英伟达面临着在Blackwell架构上的重大挑战,包括功耗控制、散热设计和封装技术等问题。这些问题不仅影响了B200/GB200芯片的交付,也可能对B300/GB300的量产和发布产生影响。英伟达需要解决这些问题,以保持其在AI服务器芯片市场的领先地位。
本文来自作者[sxkxdz]投稿,不代表快芯号立场,如若转载,请注明出处:https://vip.sxkxdz.com/zixue/202412-119238.html
评论列表(4条)
我是快芯号的签约作者“sxkxdz”!
希望本篇文章《英伟达新芯片备受期待 未上市已面临挑战 但传言称遭遇生产难题 (英伟达新芯片曝过热问题)》能对你有所帮助!
本站[快芯号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览:英伟达最新旗舰芯片B300,GB300的问题与挑战分析一、背景与概述英伟达在芯片市场的领先地位面临着严峻的考验,继B200,GB200芯片交付推迟后,新一代旗舰芯片B300,G...