人工智能工厂:规模化光子技术
英伟达(Nvidia)已发布两款基于硅基光子技术的网络交换机。该公司表示,这项技术将助力AI企业实现数百万块图形处理器(GPU)的互联。
随着人工智能基础设施规模的急剧扩大与拓展,光子技术的需求被推向了前所未有的高度。当前铜缆网络已逼近性能极限,光子链路因此被寄予厚望,用于突破带宽、功耗和延迟方面的瓶颈。
从铜缆到光通信
如今AI模型的规模令人惊叹,其参数数量已达数十亿甚至上万亿。参数是指训练过程中会调整数值以实现预测功能的内部变量,通常参数越多,模型的能力和性能越强。2019年OpenAI发布的GPT-2模型含15亿个参数,而仅四年后推出的GPT-4模型,参数数量已高达1.8万亿个。
AI模型在规模和复杂度上的指数级增长,意味着对计算能力的需求与日俱增。OpenAI的一项研究显示,自2012年起,训练最大型AI模型所需的计算能力每3.4个月就会翻倍。这使得AI工厂的规模以前所未有的速度扩张。“纵向扩展”(scaling up)指提升单台服务器的资源,例如增加更多GPU;而“横向扩展”(scaling out)则是在集群或分布式系统中增加更多服务器。如今超大规模数据中心至少容纳5000台服务器,连接设备的长度甚至可能达到数英里。
“目前,在不同GPU和机架之间传输数据时,行业仍高度依赖铜缆,仅在洲际传输等场景使用光纤,”德国专注于制造自动化解决方案的公司ficonTEC国际销售工程师安登·巴诺(Andon Bano)表示,“但光纤正越来越多地用于数据中心内部,因为即使是机架之间的数据传输需求也已过高,铜缆已无法承载。”


“我们应尽可能使用铜缆——比如在一两米的范围内,铜缆连接性能极佳,可靠性高、能效好且成本低,”黄仁勋解释道,“在纵向扩展场景中,我们会尽可能多用铜缆;但在横向扩展场景下,如今数据中心规模堪比体育场,就需要能实现更远距离传输的技术,而硅基光子技术恰好能满足这一需求。”
“直到最近,英伟达还完全依赖铜缆技术,但现在他们意识到铜缆已无法满足需求——它发热严重、功耗过高且信号损耗大,”美国麻省理工学院(MIT)首席研究科学家阿努拉达·M·阿加瓦尔(Anuradha M. Agarwal)表示,“因此,他们不得不转向光子技术。”
“在纵向扩展场景中,我们会尽可能多用铜缆;但在横向扩展场景下,如今数据中心规模堪比体育场,硅基光子技术恰好能满足这一需求。”
——黄仁勋,英伟达首席执行官兼创始人
尽管光子技术的发展仍远落后于微电子技术,但AI行业近期的投入和对技术突破的迫切需求,或许足以推动光子技术发展到能与电子技术比肩的水平。
光子集成电路的发展
如今,业界的目标是将微电子领域的部分经验应用到光子集成电路(PIC)领域。光子集成电路是一种将光子器件和光互联集成到单块芯片上的技术。自20世纪80年代中期问世以来,光子集成电路的复杂度呈指数级增长。单块芯片上集成的光子组件数量目前已接近1万个,其增长趋势与电子领域的摩尔定律相似,但滞后约25至30年。
“光子技术与电子技术的融合进展缓慢,部分原因在于行业生态——微电子领域已非常成熟,而光子技术仍处于新兴阶段,”爱尔兰廷德尔国家研究所(Tyndall National Institute)光子封装小组负责人彼得·奥布莱恩(Peter O’Brien)表示,“但对微电子领域的了解越深入,就越能推动光子技术与之兼容,降低整合难度。”
2007年,首款商用光模块问世,光子集成电路在光纤两端分别充当发射器和接收器。市场研究公司LightCounting的数据显示,受AI工厂光通信需求激增的推动,光模块中使用的激光器和光子集成电路销售额预计将从2023年的24亿美元增长至2029年的59亿美元。

然而,光子技术目前仍缺乏能与传统微电子封装流程兼容的标准技术和生产线,无法实现符合市场需求的大规模集成。例如,自2001年成立以来,ficonTEC公司主要为高端光子器件(包括光子集成电路)的组装或测试提供定制化设备,已向客户交付了1500多台设备。
“可以说,光子技术一直处于原型开发阶段。与半导体相比,光子技术的产量始终处于中低水平,”巴诺表示,“我们的许多客户需要根据其产品定制设备,而非能适配多种产品的标准设备。
随着光子行业向更高产量、更高集成密度方向发展,对光子集成电路制造解决方案的标准化、自动化和智能化开发需求也日益迫切。
转向表面连接
封装成本占总制造成本的比例可超过80%,是制约光子集成电路市场发展的关键瓶颈。光子技术封装涵盖为光子集成电路提供光接口和电接口支持所需的技术,包括光纤耦合、激光源集成、引线键合和倒装芯片集成(用于实现高效高速信号传输)。目前,封装大多采用逐器件处理的方式,难以完全自动化,进而无法实现高产量规模化生产。

传统的光纤与光子集成电路器件键合采用主动对准流程:持续测量并最大化耦合光功率,然后用紫外固化环氧树脂将光纤固定(即键合)在特定位置。由于该流程在组件或封装层面进行,产量受到限制,每个封装的周期长达几分钟到几十分钟。
奥布莱恩的研究聚焦于推动行业采用类似微电子制造的晶圆级封装技术。通过并行对准,可将每个器件的处理周期缩短至几秒,大幅提升产量。将光接口从光子集成电路的边缘(或端面,标准光纤耦合采用此方式)转移到芯片表面后,制造商可实现晶圆级封装,并借助机器视觉实现对准流程的自动化。此外,表面连接还能通过二维阵列实现更多光通道,摆脱边缘线性阵列的数量限制。
“对于机器视觉系统而言,对准芯片上波导的边缘极具挑战性,尤其是在需要满足严格对准公差的情况下,”他表示,“转向晶圆级封装后,所有元件都位于表面,自动化操作会容易得多,也更易于规模化。”
这种垂直耦合透镜有三个主要工作表面:第一个曲面用于接收发散光束并将其准直,以便与连接器对接;第二个光滑表面用于最大限度减少光散射;第三个表面负责实现光的全反射。该方案采用扩束连接方式,降低了连接器的对准公差要求——连接器本身由光纤阵列构成,端面装有微透镜。
借助这一方案,奥布莱恩及其团队在1310纳米波长下实现了光模块芯片低于2分贝的耦合损耗。对准公差放宽至约28微米,约为标准封装中光纤与光子集成电路对接耦合所需典型对准精度的35倍。随着低剖面表面安装耦合方案的进一步研发,可借助机器视觉实现元件的精密对准,从而实现此类器件组装的自动化。
“一边是研发,一边是商业化,中间却存在一道鸿沟。是行业主动对接研发,还是研究人员推动技术落地?”奥布莱恩表示,“这就是人们所说的‘死亡谷’,欧盟委员会已通过建立试点生产线来应对这一问题。这不仅是研发的加速器,也是推动技术走向产业化的重要途径。”
阿加瓦尔的实验室提出了一种创新解决方案:一种垂直光互联设计,具有低插入损耗、高平移和旋转对准公差,且与互补金属氧化物半导体(CMOS)工艺流程兼容。该设计利用光学中介层实现倏逝耦合,类似于利用电学中介层实现相邻电子器件之间的互联。
过去,借助精密光刻技术,倏逝耦合已能实现同一芯片上两个波导之间的光耦合。“现在试想在两块独立芯片之间实现同样的耦合,”她表示,“我们可以通过光刻技术制作波导,但当把两块芯片(比如将一块倒装键合到另一块上)组装在一起时,垂直方向(Z轴)的距离就变得难以控制了。”
“我们的双锥设计有助于放宽对准公差,因为即便在有效折射率匹配的情况下,光也不再是从一个波导‘跳跃’到另一个波导的单一节点传输,”阿加瓦尔表示,“相反,光的传输过渡有更长的路径可供实现。”
在2024年的一项研究中,该团队通过实验验证了这种垂直芯片-芯片倏逝耦合器:在1550纳米波长下,耦合损耗仅为0.39分贝;在C波段、S波段和L波段(1480至1640纳米)的平均损耗为0.72分贝。在1480至1640纳米波长范围内,该耦合器的1分贝横向对准公差平均达到1.38微米,可支持通过自动化拾取-放置技术实现无源组装。
“我们还设想利用倏逝耦合器实现芯片与光纤的耦合,但如何将光引导至芯片顶部并最终耦合到光纤呢?”阿加瓦尔表示,“或许可以先通过倏逝耦合器实现芯片间的光传输,再利用芯片末端的微反射镜将光耦合到光纤中。这些都是我们正在探讨的想法,也是我们下一步的研究方向。”

高通量测试
尤其是近期共封装光模块的兴起,为测试带来了新的限制——该技术将光子集成电路直接与专用集成电路(ASIC)集成在同一封装基板上,或使其紧邻专用集成电路。由于组装后无法再更换组件,必须在光子集成电路组件与电子组件永久共封装前,验证其功能、性能和可靠性。
测试是至关重要且技术难度极高的环节,需要高精度的光对准和测量。ficonTEC、FormFactor、EXFO、是德科技(Keysight)等公司正开发新一代自动化解决方案,以加快测试流程。
该系统采用两台Physik Instrumente的六足机器人(一种可在六个自由度上定位和对准负载的并联运动平台),实现光学探针的纳米级精度对准。“我们的系统正在解决业内公认的此类测试中最困难、最关键的环节之一——对准问题,”贾拉耶表示,“这看似简单,但我们面临的精度要求(电子测试以微米为单位,而我们以纳米为单位),以及不能过于靠近器件的限制,都与其他行业截然不同。”
2025年3月,ficonTEC推出了一款用于硅基光子技术的高产量双面晶圆探针测试单元,该单元可与现有半导体自动测试设备(ATE)兼容,主要面向AI工厂应用。这项技术在核心软硬件层面与自动测试设备直接对接,可实现晶圆正面的电学测试和下方的六轴主动光对准探测。
“目前,这些代工厂的常规做法是先进行电学测试,然后取出晶圆再进行光子技术测试,”巴诺表示,“我们和其他公司此前已能提供光子芯片的光电测试服务,但这些服务不符合代工厂所需的标准,无法与自动测试设备兼容——这种情况直到现在才得以改变。”

展望未来
“AI工厂是一类规模极致的新型数据中心,必须重新设计网络基础设施才能跟上其发展步伐,”英伟达的黄仁勋在2025年3月的新闻稿中表示,“通过将硅基光子技术直接集成到交换机中,英伟达打破了超大规模和企业级网络的传统限制,为可容纳数百万块GPU的AI工厂打开了大门。”
英伟达基于共封装光模块的网络交换机宣称,与传统方案相比,仅需1/4的激光器数量,就能实现3.5倍的能效提升、63倍的信号完整性提升、10倍的大规模网络弹性提升,以及1.3倍的部署速度提升。此类技术的需求将持续增长,因此光子技术制造商必须找到方法,以适应更高产量和更快创新节奏的需求。
“如今共封装光模块的重要性,堪比当年贝尔实验室发明晶体管——它将彻底改变电子领域的格局,”阿加瓦尔表示,“在我看来,一旦进入共封装时代,我们就再也不会回头。光子技术领域将迎来一个全新的世界。”
自动化是应对诸多挑战的关键。它能快速扩大产量,同时降低对人工的依赖,最终实现成本降低、生产优化,并保持竞争优势。尽管自动主动对准等创新已对行业产生显著影响,但将AI引入制造流程无疑是合乎逻辑的下一步。
Physik Instrumente公司正研发多款适用于工业光子技术应用的新型对准算法,这些算法整合了AI技术,覆盖从晶圆探测到最终封装的全流程。2024年,该公司推出了用于光子对准的全自动PILightning算法,无需耗时的搜索流程或人工干预。PILightning算法通过集成基于AI的实时执行功能的搜索方法,可实现首次光信号探测。
通过这些创新,光子技术制造商可借助自动化保持领先地位,确保这一被大型科技公司视为关键基础设施的领域持续发展。“即使在五年前,人们还将光子技术视为‘迪士尼式的继子’:知道它的存在,却没人真正重视,”阿加瓦尔表示,“但现在,英伟达、英特尔、苹果等所有企业都纷纷投身这一领域,台积电(TSMC)、三星等代工厂也不例外。他们逐渐意识到:‘光子技术其实是我们不可或缺的核心领域,没有它,我们就无法前行。’”
资讯原作者:Meeri Kim,有关参考资料和资源,请访问:optica-opn.org/link/photonics-ai-factories。
- 收藏


