随着生成式人工智能和大模型技术的快速发展,人们对于算力的需求呈指数级增长,提高芯片的集成密度虽然可以有效解决高算力对芯片性能和处理效率的要求,但也导致了总热功耗增加、热分布不均、封装中的热输运困难等等问题,如何有效解决以上热管理问题,是当前高算力时代我们亟待解决的问题。Chiplet(芯粒)技术相较传统的系统级芯片(SoC),可以实现更大面积、更多功能、更高密度的芯片集成,被认为是后摩尔时代集成电路发展的关键路径和突破口。接下来,小编将以Chiplet技术为案例,跟大家谈一谈可以用于芯片热管理的方案。
图源:百汇商场
相关阅读:
Part.1为什么会有这些热管理问题?
由于Chiplet技术是一种将单片SoC芯片分割成一个个单独的Chiplet,再通过先进封装技术将这些Chiplet组装,最终形成多功能、高性能芯片的制造手段,因此在不同功能、不同类型Chiplet集成的过程中,会涉及到多种异质材料的使用与整合,这些材料的热膨胀系数、热导率等物理参数、物理特性往往会存在较大的差异,在系统运行时会导致严重的热应力,产生翘曲、裂纹、分层等问题,使得系统功能衰退,甚至产生失效和破坏。目前Chiplet的封装方式主要为2.5D/3D集成,在3D封装时,底部芯片产生的热量会通过微凸点层、层间金属布线层以及上层芯片进行传导,但由于微凸点层的等效热导率较低,会存在热输运困难的情况。为了能够更加满足复杂场景的应用需求,往往会在Chiplet异质集成中添加不同的功能设计,而这会显著增加功率分布不均匀的情况,例如,电压调节器的功率较高,会在芯片中形成高功率热点。
集成芯片散热示意图(图源:文献1)
总而言之,Chiplet的高功耗、高集成度给热管理带来了严峻的挑战,提出一系列迫切需要研究的关键技术问题。
Part.2芯片热管理解决方案
目前国内外高校、研究机构或企业针对芯片热管理开展了包括微通道单相冷却、微通道两相冷却、射流冷却、浸没式冷却、新型TIM、不均匀热分布调控等方面的研究,并取得了一些进展与突破,有望用于高算力Chiplet的热管理。
一、热界面材料(TIM)
在一般的电子设备中,芯片产生的热量会经散热器到达热沉,想要拥有良好散热效果的前提是热源与散热组件之间存在良好的接触,但通常两者的接触面积只占宏观表面积很小的一部分,剩余充斥着“热”的不良导体——空气。由于空气的导热系数极低,会严重阻碍热传递,因此大部分的热量主要通过有限的接触点进行传递。为了能够有效增强界面的热交换,会选择具有较高导热系数的热界面材料填补热源与散热器之间的空隙,以增加有效的接触面积,实现热量的快速传导,达到快速散热的目的。常见的热界面材料主要分为聚合物和金属两大类。
1、聚合物TIM
聚合物TIM是目前市面上应用范围最广的TIM,按材料的状态可以分为脂类、垫类、凝胶类、相变材料类。
(1)导热硅脂
通常由高导热填料和有一定流动性的有机硅液体通过研磨并经过真空脱泡制成,是一种呈液态、能够有效促进传热的膏状材料。由于具有一定的流动性,它可以在粗糙表面上流动并填充在细小的坑洼处,具备较优的导热性能,但是由于导热硅脂泵出效应明显,长期使用会使导热硅脂的溶剂挥发,导致导热硅脂变干,降低了其可靠性。
(2)导热垫片
一般是以高分子聚合物为基体,在其中加入高导热颗粒后,经加热固化处理,形成兼有柔性和弹性特点的一类片状材料。导热垫片通常具有粘性,与其他固体接触时不需要额外的表面粘合剂。由于具有较好的电绝缘性能,在电子元件微型化的趋势中,可以最大化发挥密封和绝缘的功能。但导热垫片在使用过程中会受厚度、形状的限制,当设备运行温度上升时,导热垫片可能会变软,发生蠕变或应力松弛,从而影响其机械强度,电子设备的各种性能也会出现下降的趋势。
(3)导热凝胶
又称导热泥、导热硅凝胶,是一种由有机硅粘结形成的密封胶。在未使用时为液态,封装之后经加热固化变为固态,在一定程度上消除了泵出效应,粘接层厚度大约在0.05-0.25mm之间。导热凝胶相较导热垫片更为柔软,可压缩至非常薄的厚度,特别适合空间受限的器件的热传导。相较导热硅脂更易操作,它还可以形成任意需要的形状,对于不规则器件均能保证良好的接触,不存在出油和变干的问题,在可靠性上具有一定的优势。但由于器件的热膨胀系数存在差异,当其长期工作在冷热交替环境中时,由于存在应力,可能会出现分层现象,从而影响散热性能。
(4)导热相变材料
按相变类型的不同,导热相变材料可分为固-固和固-液相变材料。固-固相变材料发生相变时无液体产生且体积变化较小,因而不易发生相分离;而固-液相变材料的品种繁多,相变潜热值大,发生相变时会产生残余热应力,易发生填料与基体的相间分离,因此应用时需克服相变产生的液相流动和泄漏问题。总的来说,固-液相变材料因其品种繁多且潜热值更大往往具有更高的实用价值。导热相变材料主要以热塑性材料为基体,基体的熔化温度位于室温和工作温度之间,当温度升高到基体熔点以上时会发生相变成为液态,从而润湿热界面,能够最大程度地填充界面空隙,其相变潜热可防止温度急剧变化。导热相变材料在常温下是固体,对很多表面粘贴封装器件的场合非常适用,常用于计算机、处理器、电源模块等的导热应用。
TIMs的界面间热阻(图源:文献6)
2、金属TIM
传统聚合物TIM的热导率低,难以支持高算力Chiplet的冷却需求。金属TIM的热导率较高且通过焊接能够在接触界面形成连续的热通道,以显著降低热阻。但金属TIM的模量较高,会在封装中引入较大的应力。
(1)焊料TIM
目前业界最常见的商用金属TIM为铟,铟的模量较低,能够贴合于焊接面并吸收内部应力,纯铟的热导率为86W/(m·K),熔点为157℃,是理想的金属TIM。AMD采用铟作为高端处理器的TIM,但是铟的价格高且供应量有限。出于成本考虑,以SnAgCu合金为主的无铅焊料也被广泛用作TIM,但SnAgCu合金的机械性能和可靠性不如纯铟。通过将焊料基体与填料或其他纳米结构材料相结合,可以获得高热导率并改善其机械性能,这是焊料TIM目前的发展方向。
(2)液态金属TIM
以镓基液态合金为代表的液态金属也可以用作TIM,常压下其熔点小于29.7℃,具有出色的流动性,可以显著降低热应力。但是液态金属具有较大的表面张力,难以与接触表面实现紧密结合,并且液态金属泄漏导致器件短路的风险很大,一定程度上限制了液态金属TIM的发展。中国科学院理化研究所的GAO等发现纳米级的镓氧化物可以改善其润湿性,纯镓在铜表面的润湿性较差,但通过在镓中添加氧化物,可以使其均匀地涂抹在铜、钢和硅的表面。引入氧化膜是提高镓基液态合金作为TIM的性能的有效方法。
(3)微纳结构金属TIM
为了有效发挥作用,金属TIM必须在合理的装配压力下与配合表面保持良好接触,其厚度必须足够大,以适应配合表面的不规则性和非平面性。虽然铟作为TIM的热导率很高,但是它对非平面和高粗糙度表面的适应能力有限。为了增加铟的塑性,并在接触界面形成连续的高导热通道,铟泰公司的KEMPERS等开发了一种微纹理铟基TIM,该TIM表面有一些小尺寸的凸起纹理,这些凸起纹理经过压缩后会发生塑性变形,可以更好地适配接触界面,改善了普通铟膜的填隙性。这种具有微纳结构的TIM可以显著降低热阻,相比于石墨垫TIM,微纹理铟基TIM可以将设备的温度再降低14.9℃。在实际应用中,对微纹理铟基TIM进行系统功率循环测试,在从零功率到全功率的100次循环中,设备的温度保持恒定。
加入热界面材料后界面热阻位置示意图(图源:文献8)
二、高效对流换热技术
对流换热是Chiplet技术将热功耗排散到环境中的重要环节。传统的空气对流换热已经不能满足Chiplet的热管理需求,需要采用对流系数更高的液体工质,常见的高效液体换热技术主要有微通道单相冷却、微通道流动沸腾(两相)冷却、射流冷却以及浸没式冷却。
1、微通道单相冷却
微通道冷却是指通过基板上刻蚀的微尺度通道来散热,热量会通过基板传导至微通道中流动的工作流体,再由工作流体传导至器件外。微通道散热系统由于具有温度均匀性好、设备系统结构简单、质量小、运行稳定等优点,有望成为未来高密度发热电子设备散热的方案之一。单相冷却是指在整个冷却过程中冷却介质始终保持同一状态,不发生沸腾或冷凝的情况。相较常规单相冷却系统,微通道单相冷却系统在相同体积下有着更大的换热面积,具有微尺度效应,整体散热性能更高。目前,微通道内单相传热的研究已经较为充分,但微通道单相冷却系统也存在一些问题,如当需要散热的器件封装较大时,所需的微通道单相冷却系统的微通道长度会过长,造成较大的进出口温差,可能会导致半导体器件因温度不均匀而热失控。
DC-DC变换器微流体冷却装置(图源:文献2)
2、微通道流动沸腾(两相)冷却
微通道单相冷却技术虽然可以实现对500W/cm2以下量级热流密度芯片的有效冷却,但当芯片热流密度达到500W/cm2甚至1kW/cm2量级时,单相冷却方案就无法满足冷却需求,此时我们就可以使用微通道流动沸腾(两相)冷却技术,利用冷却工质的相变潜热,实现微通道冷却能力的进一步提升。
微通道两相冷却技术主要是利用流体在流动-沸腾-冷凝过程中的热效应来实现冷却效果的,是缓解单相冷却中进出口温差大的优秀的潜在解决方案之一。在多数情况下,散热器的壁温会始终高于作为工质的流体,因此在液体沸腾过程中,工质温度为局部压力下的饱和温度。与微通道单相换热相比,两相换热的工质温度变化较小,因此两相换热可以提高散热装置壁面温度的均匀性。如果单相换热要达到与双相换热一样的均温性,则需要大功率的工质泵,来提高工质流速。两相换热利用了工质的潜热,所以在工质流量较小的情况下也可以达到更高的传热系数,这一点可以较好的满足集成电路微型化、高度集成化的发展需求。
两相分层歧管微流道散热技术概念图(图源:文献4)
3、射流冷却
射流冷却是冷却液在喷嘴的压差作用下以很高的速度直接冲击热源表面来实现高效换热的一种冷却方式。一般情况下,射流冲击流场会被分为自由射流区、滞止区以及壁面射流区。其中,滞止区是射流冷却的主要作用区域,流体会在该区域形成很薄的速度边界层和温度边界层,边界层内温度梯度、轴向速度梯度和压力梯度很大,使边界层内各参数发生剧烈变化,形成较强的对流换热,进而将热量从芯片中排出。最初射流冷却使用的工质是空气,由于液体具有更好的热性能,液体射流冷却逐步成为研究热点。
当前,射流冷却技术的主要研究方向为射流传热结构的优化(包括喷嘴孔型的优化、喷嘴排列方式的优化以及表面结构的优化)、射流高效冷却液和射流沸腾换热。其中,对射流喷嘴孔型进行优化的主要是为了通过改变喷嘴的形状,改变冷却液在喷嘴出口处的速度矢量,使其冲击在芯片表面时,产生不同的流动特性,以此强化冷却液与芯片间的换热效果;对射流喷嘴的排列方式进行优化主要是为了改善芯片整体的温度均匀性。单孔射流会在滞止区形成强烈的对流换热,当流体逐步远离滞止区后,对流换热系数快速衰减,导致芯片表面温差过大,而将喷嘴阵列排布后,芯片表面会形成多个强对流换热区域,可以有效改善芯片整体温度的均匀性;对射流冷却表面结构优化的主要目的是通过改变流体在表面的流动特性,来增大换热面积和增加汽化核心强化冷却液与芯片间的换热。
阵列射流冷却结构(图源:文献3)
4、浸没式两相冷却
浸没式冷却是一种高效的直接液冷技术,它主要是将发热器件与绝缘液体直接接触并进行热交换,不需要芯片周围的冷板管路,系统复杂性较低,可以轻松适应不同的冷却负荷。根据热交换过程中传热介质是否存在相变变化,可以将浸没式冷却分为单相浸没和两相浸没两类。在两相浸没式冷却时,流体从芯片处吸收热量后会蒸发,在热交换器的帮助下冷凝,由于潜热的存在,它的散热能力比单相浸没的更高。由于所有器件均可浸入冷却液中,不需要额外的风冷装置,因此浸没式两相冷却可以获得更优的电源使用效率,是未来基于高算力Chiplet的数据中心或超算中心主流的冷却方式之一。
两相浸没冷却系统原理图(图源:文献7)
参考文献:
1、吴作栋,谭公礼,张方驹.三维集成芯片散热技术研究[J].舰船电子对抗.
2、盛况,唐苇羽,吴赞.碳化硅功率模块封装及热管理关键技术[J].
3、冯剑雨,陈钏,曹立强,等.高算力Chiplet的热管理技术研究进展[J].电子与封装.
4、张志模,张爱兵,汤莲花,等.面向三维立体集成封装的微流道散热技术[J].中国集成电路.
5、徐晓宇.功率芯片热管理强化技术研究[D].吉林大学.
6、吉晓霞,秦明礼,吴昊阳,等.热界面材料概况及性能影响因素[J].有机硅材料.
7、孙晓晴.数据中心两相浸没式系统冷却性能研究[D].东北大学.
8、解红杰.热管理功能聚合物复合材料的制备及性能研究[D].天津理工大学.
粉体圈整理
供应信息
采购需求