未来已来:世界首批使用金刚石冷却的AI服务器正式上线

发布时间 | 2026-02-27 16:37 分类 | 行业要闻 点击量 | 6
金刚石
导读:2月23日,世界上首批使用金刚石冷却的英伟达H200 GPU服务器在位于班加罗尔的印度主权人工智能巨头NxtGen AI部署上线,这些服务器采用Akash Systems的专利金刚石冷却技术,提供15%更多的可用计算...

2月23日,世界上首批使用金刚石冷却的英伟达H200 GPU服务器在位于班加罗尔的印度主权人工智能巨头NxtGen AI部署上线,这些服务器采用Akash Systems的专利金刚石冷却技术,提供15%更多的可用计算能力,GPU热点(局部)温度降低5℃,并且在环境温度高达50℃(122℉)时无需限速运行。


图源:technosports

Akash Systems来头不小,由著名硅谷投资机构Khosla Ventures和Founders Fund推动建立,并且从美国商务部获得共计6800万美元资金支持以扩大生产。2024年底,Akash Systems与NxtGen AI签署了这项高达2700万美元(约225亿卢比)的合同,以期打造出世界上能源效率最高的AI算力供应商(AI计算成本降低50%)。

目前,GPU热管理路线众多,比如液态浸没、直接芯片冷却等等。Akash开发的金刚石冷却系统自定义为非替代性,而是可以叠加到其他冷却系统的辅助性热管理技术。除了与其他热管理技术配合获得更好冷却效果,它也不与英伟达捆绑,而是和包括AMD、Intel在内的GUP产品均可结合使用,市场上限极高。本次上线服务器产品的技术细节虽然并未公布,但小编根据官方产品和可查询专利资料进行整合,梳理出较浅显的实现路径以供参考。

这是一种以金刚石替代铜的冷却技术,主要利用金刚石的超高热导率降低热梯度,使GPU中HBM局部过热减少。从材料而言,是MPCVD金刚石衬底+金属化,与芯片键合并与其他导热结构(TIM、风扇、液冷等)集成实现均热、散热。

总结

以上描述很笼统,其中的技术难点和成本控制点非常多,比如金属化为多级堆栈,涉及Ti/W粘附层、Mo过渡层、电镀铜、镍焊接层等,不仅要保证导热能力,还要能吸收CET(热膨胀系数)不匹配带来的应力;再比如金刚石衬底需要超精密抛光处理,才能减少翘曲、晶界粗糙等导致的芯片贴合缺陷或应力。

NxtGen AI上线金刚石冷却GPU服务器有一条评论很有趣——印度的环境温度大多数时候都高于35℃,这导致冷却成本极高。Akash Systems的专利金刚石冷却技术带来的稳定算力提升效果,尤其对印度AI公司有着巨大诱惑。

 

粉体圈 整理

作者:粉体圈

总阅读量:6