用激光给芯片降温？！

2025-11-20

一家初创公司计划通过把热量直接变成光来冷却数据中心

现代高性能芯片是工程学的奇迹，里面塞进了数百亿个晶体管。问题在于，你不可能同时用满它们。如果真的一起开满，就会产生“热点”（hot spot）——极小的区域内温度急剧升高，功率密度接近太阳表面。这导致了一个令人沮丧的悖论——“暗硅”（dark silicon）。计算机架构师用这个词来描述芯片上必须保持断电的那部分区域。在现代芯片上，任何一个时刻最多有80%的晶体管必须保持“黑暗”，否则芯片就会被烤焦。我们用一小块硅造出了超级计算机，却只能发挥它一小部分潜力，就像盖了一栋摩天大楼，却只能使用前10层。

几十年来，产业界一直靠更大的风扇、更复杂的液冷系统来对抗热极限。但这些本质上都是“创可贴”。无论是风冷还是液冷，都只能把热量从芯片表面拉走——热量必须先穿过硅衬底到达冷却板，这在未来芯片的功率密度下根本无法突破瓶颈。今天芯片上的热点已经能产生每平方毫米几十瓦的热量，而且在计算过程中会在芯片不同位置随机冒出来。风冷和液冷很难精准地只对准当时冒出来的热点，它们只能“大水漫灌”式地冷却整个芯片。

位于美国明尼苏达州圣保罗的初创公司 Maxwell Labs 提出了一种彻底颠覆性的新方法：与其费尽心思搬运热量，不如让热量直接“消失”。我们把这项技术称为光子冷却（photonic cooling），它能把热量直接转换成光，实现从芯片内部向外冷却。产生的能量随后还能被回收，重新变成有用的电能。这样，我们就能像激光一样精准地只冷却正在形成的热点，而不是均匀冷却整个芯片。从原理上讲，这种技术可以冷却每平方毫米数千瓦的热点——比今天芯片的冷却能力高出几个数量级。

光冷却的物理原理

激光通常被认为是热源，这很有道理——它们最常用来切割材料或传输数据。但在特定条件下，激光其实可以致冷。秘密在于一种叫荧光（fluorescence）的发光现象。

荧光就是荧光笔、珊瑚礁、在黑光灯下发白的衣服发光的原因。这些材料吸收高能量光子（通常是紫外光），再发射出能量较低的光（通常是可见光）。因为吸收的能量高于发射的能量，差额通常会让材料升温。但在极少数特殊条件下，会发生相反的情况：材料吸收低能量光子，发射出高能量光子，自身反而被冷却。

要实现激光冷却芯片，Maxwell Labs 计划在芯片衬底上方布置一层光子冷板网格。在我们的演示系统中，热成像仪先探测到芯片上冒出来的热点，然后激光照射到热点正上方的光子冷板，激发冷却过程。

光子冷板包含几个关键部件：

耦合器（coupler）：引导光进出冷板
提取器（extractor）：发生反斯托克斯荧光（anti-Stokes fluorescence）的地方，也是真正制冷的核心区域
背反射器（back reflector）：防止光进入下方的芯片
传感器：实时探测热点位置

发射出的高能量光子其实是入射光子能量 + 材料晶格振动（声子，phonons）的总和。这种现象叫反斯托克斯冷却，1995年首次在固体中实现，当时科学家用激光把掺镱的氟化物玻璃冷却了下来。

掺杂镱（ytterbium）并非随意选择：反斯托克斯冷却需要极其精密的工程条件。吸收材料必须保证几乎每个被吸收的光子最终都能发射出一个更高能量的光子，否则其他机制会占主导，导致升温而非降温。镱离子等镧系元素拥有合适的电子轨道结构，在特定波长的激光照射下，它们能高效吸收光子，并利用声子触发更高能量光子的发射。发射出的热光必须迅速逃逸，否则会被再次吸收导致升温。

目前实验室已能在掺镱二氧化硅玻璃中实现最高90瓦的冷却功率。虽然成绩亮眼，但要真正改变高性能芯片的热现状，我们需要把冷却能力再提升几个数量级。关键在于把光子冷却机制集成到芯片级的薄膜光子冷板中。小型化不仅能用更聚焦的光束精准打击热点，还能把激光冷却的物理极限推向更高功率、更高效率的区间。薄膜越薄，发射光被再次吸收导致升温的概率越低；同时在光波长尺度上对材料进行工程设计，还能显著提高入射激光的吸收率。

光子冷板技术细节

我们正在开发的冷板能自动感知功率密度升高的区域（即将形成的热点），然后把激光高效耦合到附近区域，把温度降到目标值。

冷板主要由以下部分组成：

耦合器：把外部激光聚焦进微型制冷区，同时把携带热量的荧光导出芯片
微型制冷区（提取器）：掺杂特殊离子的薄膜在此发生反斯托克斯荧光，实现真正冷却
背反射器：防止入射激光和荧光进入下方芯片加热电子器件
传感器：实时探测热点位置，引导激光对准

冷却只在激光照射的位置和时刻发生。通过控制激光照射位置，我们就能精准打击实时热点。

整个堆叠的设计极其复杂，涉及耦合器形状、提取区材料与掺杂浓度、背反射器层数与厚度等大量可调参数。我们使用多物理场仿真结合逆向设计（inverse design）工具，在海量参数空间中寻找最优解。目前目标是把冷却功率密度提升两个数量级，后续更大规模仿真有望带来更大突破。

我们正与新墨西哥大学、圣托马斯大学和桑迪亚国家实验室合作，在圣保罗实验室搭建光子冷却演示系统。目前已制作出1mm×1mm的光子冷板阵列，贴在多种CPU上进行测试。演示中用外部热成像仪探测热点，一旦热点出现，激光立即打到正上方的冷板单元上，把热量抽走。第一代冷板使用掺镱离子，最新一代正在尝试多种新型掺杂剂，预计性能大幅提升。

下一阶段我们将把冷板单元缩小到100×100微米级别，不再使用自由空间激光，而是通过片上光子网络把光纤中的光分配到对应单元。哪个单元被激活，完全取决于传感器探测到的热点位置和时间。

最终目标是与CPU/GPU厂商合作，把光子冷板直接集成到芯片同封装内，让关键的提取层尽可能贴近热点，进一步提升冷却能力。

激光冷却芯片对数据中心的影响

我们对激光冷却的热力学进行了分析，并与传统风冷、液冷对比。初步结果显示，即使是第一代激光冷却系统，散热能力也达到纯风冷/液冷系统的两倍以上。这种颠覆性提升将带来几个关键改变：

彻底消灭暗硅

实时精准移除热点热量，让芯片上更多晶体管能同时工作，充分发挥现代晶体管密度。

大幅提高主频

当前芯片热点温度常达90–120℃，激光冷却可把全芯片温度控制在50℃以下，为同工艺芯片带来更高主频，为摩尔定律延续争取宝贵空间。

让3D集成热学上变得可行

每层都加光子冷板，就能轻松解决3D堆叠中间层的散热难题。

整体能耗大幅下降

与风冷结合使用，可为当前一代芯片节省50%以上总能耗，未来芯片节省幅度更大。

废热回收效率革命性提升

传统液冷/风冷回收废热效率很低，而光子冷却产生的荧光可通过光纤收集，再用热光伏（thermophotovoltaics）转为电能，回收率高达60%以上。

这种全新冷却思路将彻底改写芯片和数据中心的设计规则。我们相信，这正是让摩尔定律继续前进、同时在数据中心层面大幅节省电能的关键技术，也将为当下正在爆发的智能爆炸（intelligence explosion）铺平道路。

光子冷却的商业化之路

尽管结果非常令人振奋，但距离商用还有几大挑战：

当前冷板材料仅满足基本要求，未来需要开发更高效率的激光冷却材料
目前仅有少数材料被提纯到足以实现激光冷却的程度
需要与处理器、封装、冷却系统协同设计，打破半导体生态的传统壁垒
从实验室走向高量产需要全新的工艺和专用设备，以及光学接口、安全协议、性能标准等新行业标准

不过我们目前看不到任何原理性障碍阻挡光子冷却的大规模采用。

我们的路线图：

2027年前：率先在高性能计算和AI训练集群落地，冷却性能功耗比提升一个数量级

2028–2030年：主流数据中心部署，IT整体能耗降低40%，同时计算能力翻倍

2030年后：从超大规模到边缘全面普及，计算性能将只受算法效率限制，而不再受热学限制

过去二十多年，半导体行业一直被“暗硅”阴云笼罩。光子冷却不仅解决了这个问题，更重新定义了性能、计算与能量的关系——把废热直接变成有用的光子、再变回电能，把热管理从“必要之恶”变成了宝贵资源。

计算的未来将是光子的、高效的、并且——炫酷地冷。

（本文发表于2025年11月IEEE Spectrum印刷版，标题《How to Cool Chips With Lasers》）