计算光刻研究及进展

2024-08-15

摘要

光刻是将集成电路器件的结构图形从掩模转移到硅片或其他半导体基片表面上的工艺过程，是实现高端芯片量产的关键技术。在摩尔定律的推动下，光刻技术跨越了90~7 nm及以下的多个工艺节点，逐步逼近其分辨率的物理极限。同时，光刻系统的衍射受限特性，以及各类系统像差、误差和工艺偏差，都会严重影响光刻成像精度。此时，必须采用计算光刻技术来提高光刻成像分辨率和图形保真度。计算光刻是涉及光学、半导体技术、计算科学、图像与信号处理、材料科学、信息学等多个专业的交叉研究领域。它以光学成像和工艺建模为基础，采用数学方法对光刻成像过程进行全链路的仿真与优化，实现成像误差的高精度补偿，能够有效提升工艺窗口和芯片制造良率，降低光刻工艺的研发周期与成本，目前已成为高端芯片制程的核心环节之一。

本文首先简单介绍了计算光刻的前身，即传统的分辨率增强技术，在此基础上介绍了计算光刻的基本原理、模型和算法。之后对光学邻近效应校正、光源优化和光源掩模联合优化三种常用的计算光刻技术进行了综述，总结了相关的研究进展、成果和应用。最后，阐述了计算光刻当前所面临的需求与挑战，并讨论了最新技术进展和未来发展方向。

01 引言

集成电路（IC）是采用半导体工艺，在同一个硅片上制作大量电路基本元件（如晶体管、电阻、电容、电感等），通过布线将上述元件互联，并进行管壳封装后，所形成的具有特定电路功能的微型结构器件［1-2］。它具有体积小、耗电低、稳定性高等优点。自从20世纪50至60年代基尔比和诺伊思等科学家发明集成电路以来，其应用已经深入到国民经济的各个领域和人类生活的方方面面。小到智能手机、身份证、体内植入芯片、微米机器人，大到高铁、航天航空器、超大规模计算集群、5G网络、互联网和物联网，都能看到各类集成电路芯片的身影［3］。作为信息技术硬件载体的核心部件，集成电路被誉为现代信息产业的基石，其产生和进步已经深刻地改变了人类的社会形态和生活方式，甚至影响着人类未来的科技发展水平。

集成电路芯片的生产流程大体上可以分为设计、制造和封装测试三个环节［1］。光刻是集成电路制造中最关键、最精密、最复杂、成本最高的工艺（约占集成电路制造成本的30%以上）［1］，它需要根据电路设计要求，在晶圆上生成尺寸精确的特定电路图形。这一过程在很大程度上决定了集成电路制造的成败与精细化水平，对芯片制造良率和产率具有至关重要的影响作用。如图1所示，光刻工艺节点的水平通常用集成电路关键层设计版图的最小线宽来衡量，又称为关键尺寸（CD）［4］。另外，CD也可用来指代实际晶圆成像中的最小线条宽度。

图 1. 集成电路版图中的关键尺寸

集成电路的图形转移需要依靠光刻系统成像来实现。光刻机是人类迄今为止能够制造的最复杂、最精密的光学成像系统，被誉为半导体工业“皇冠上的明珠”［5］。图2［1］展示了一个典型的深紫外（DUV）浸没式光刻机的成像过程和系统结构。

图 2. DUV浸没式光刻机的（a）成像过程示意图和（b）系统结构简图［1］

以图2中的光刻成像过程为例，首先需要根据集成电路的设计版图制备光刻掩模。DUV光刻掩模是在透光的玻璃基底表面镀上一层阻光的薄金属材料（通常为铬），之后采用掩模制造设备在金属层上刻蚀出所需的电路图案。DUV光刻机采用准分子激光器作为光源［6］，光源发射的深紫外光波经过科勒照明系统后，以特定的方式（如传统照明、离轴照明、像素化自由形态照明）对掩模进行均匀照射［7-8］。一部分光波透过掩模并发生衍射，在掩模下表面附近形成衍射近场，而掩模的衍射近场中携带了集成电路的图形信息。随后，光线继续传播形成远场衍射，一部分衍射光被投影物镜收集，会聚到附着光刻胶的晶圆表面。此时光波发生干涉，并在光刻胶表面形成稳定的光强分布，称为空间像。光刻胶是一种高分子光敏材料，其功能类似于照相机底片。当照射剂量达到一定程度时，光刻胶将发生光化学反应，其溶解度等特性将发生改变。经过光刻胶的曝光、显影（即采用显影液溶解并去除部分光刻胶）等工艺步骤，即可实现电路版图向晶圆的复刻转移，为后续的刻蚀、选择性沉积、扩散和离子注入掺杂等工艺奠定基础［9］。

1965年Intel公司的联合创始人戈登·摩尔提出了著名的摩尔定律，预测出芯片所能容纳的晶体管等器件的数量约每18个月提升1倍，集成电路的性能也将随之提升1倍［10］。随着技术节点的不断推进，集成电路的CD不断缩小，半导体器件的集成度也在与日俱增。为满足集成电路制造良率的要求，必须不断提升光刻系统的成像分辨率和图形复刻精度。根据瑞利分辨率公式，投影光刻系统的成像分辨率可以表示为［11］

由瑞利公式可知，提高光刻分辨率的方式包括：缩短光源波长λ、增大数值孔径NA，以及降低工艺因子。由于受到光刻系统设计、加工和制造能力的限制，光源波长和NA在一段时间内相对固定。此时可以通过优化光刻工艺参数降低因子，达到提高成像分辨率的目的。能够降低因子的途径包括：改变光源几何形态、掩模图案、掩模透过率函数相位，以及光刻工艺等，这些方法统称为分辨率增强技术（RET）［13］。传统的RET技术包括光学邻近效应校正（OPC）［14-15］、相移掩模（PSM）［16-17］、离轴照明（OAI）［7］、双图形（DP）［18］、多重图形（MP）［19］和自对准工艺（SAP）［20］等。其中，OPC、PSM和OAI技术通过改变光学成像参数来提高分辨率，而DP、MP和SAP技术通过改变工艺流程来提高成像分辨率。

随着光刻技术发展到90~45 nm及以下工艺节点，集成电路的CD已经进入深亚波长量级，即CD远远小于曝光波长。此时，光波的干涉和衍射效应、厚掩模的三维效应、光波的偏振特性、光学投影物镜像差、系统误差、光刻工艺中的变化因素（如离焦、曝光剂量变化等）都将严重影响光刻成像结果，导致光刻图形产生扭曲和失真［21］。面对日益先进的工艺节点，传统的RET技术已经无法满足光刻成像误差的补偿精度要求。为此，研究人员将RET技术原理与数学建模和数值算法相结合，提出并发展了计算光刻技术［2］。

计算光刻是基于光学成像和光刻工艺模型，采用数学方法对光刻系统参数和工艺参数进行独立或综合优化设计，用于提高光刻成像精度和IC制造良率，缩短IC工艺研发周期，降低IC制造成本的一类技术的总称。对于90 nm以下技术节点，必须采用计算光刻技术来提升光刻系统的成像性能，否则将无法实现尺寸精良的集成电路量产。因此，计算光刻是支撑光刻工艺节点不断推进的关键电子设计自动化（EDA）仿真技术。从发展历程来看，计算光刻的前身可以追溯到传统的RET技术。当RET技术更多地依赖数学建模和数值算法时，便逐步过渡到计算光刻技术。当前，计算光刻的研究涉及光学理论、半导体技术、数学建模、数值优化、先进图像与信号处理、人工智能、电子化学材料等多个领域，是一项典型的多学科交叉技术领域。

目前产业界常用的计算光刻技术包括：光源优化（SO）［22-23］、基于模型的OPC（MBOPC）［15，24］、光源掩模优化（SMO）［25-26］等。同时，为了满足日趋严苛的成像精度与仿真性能要求，研究人员不断创新计算光刻模型与算法，研发出了多种高效率、高精度、高维度和高可制造性的新型计算光刻技术。在过去较长的一段时间内，193 nm的DUV光刻机一直是先进半导体生产中的主流设备，同时浸没式DUV光刻机与RET和计算光刻技术相结合，已成功实现了10~7 nm集成电路的量产。

鉴于上述原因，本文主要以DUV光刻系统为例，介绍计算光刻的概念和技术特点，其中部分关键技术思想可以迁移到EUV光刻系统，并对EUV计算光刻技术的发展起到借鉴和参考作用［27］。第二章将首先简要介绍传统的RET技术。第三章将从数学优化理论的角度阐述计算光刻的基本问题，并介绍计算光刻的模型基础和基本算法原理。第四章将针对SO、OPC和SMO三种常用的计算光刻技术加以详细说明，并讨论其应用方法和效果。第五章将分析当前计算光刻所面临的问题与挑战，并介绍计算光刻的最新进展。这些新型技术有望在未来解决先进半导体工艺中的某些痛点问题，具有一定的启发意义。最后是结论与展望。

02 传统的分辨率增强技术

在实际的光刻工艺中，成像结果受到多种因素的影响。首先，光刻机的曝光系统是衍射受限的，光波在透过掩模后发生衍射，只有较低级次的衍射光能够被投影物镜收集。因此，掩模上任何理想的特征图形经过成像后都将产生扭曲和畸变。另外，相邻掩模区域的透射光线在晶圆上方形成干涉图像，掩模上任何一处位置的成像结果，都将受到周围一定范围内其他图形结构的影响。这种由干涉和衍射导致光刻成像偏差的现象称为光学邻近效应（OPE）。这将有可能导致成像的边缘轮廓走形，角落变圆滑，相邻图形之间出现桥连或相连图形出现断线等。

实际的光刻掩模并非一个无厚度的薄层，而是具有特定图形的三维立体结构。这种三维拓扑结构将改变掩模衍射场的振幅、相位和偏振态等参数，进而影响光刻成像结果和工艺窗口（PW），这种现象称为掩模的三维效应，或厚掩模效应。另外，对于高NA（>0.9）和超大NA（>1）光刻系统，照明偏振态将对成像结果产生无法忽视的影响。在实际系统中，投影物镜的像差会引起光刻图形的误差和偏移［28］。同时，还必须考虑光源曝光量变化、掩模和晶圆离焦等其他工艺变化因素导致的成像CD变化和图形畸变。在光刻胶的曝光、显影过程中，光刻空间像需要通过光刻胶内的潜像，转移为最终显影后的光刻胶成像轮廓，因此光刻胶效应也是影响成像结果的一个重要因素。

当集成电路制程步入180 nm及以下节点后，电路版图的CD已经开始小于曝光波长，业界也开始广泛使用RET技术来进一步提高光刻系统的成像分辨率，满足工艺窗口的需求。下面将简单介绍OPC、PSM和OAI三种常用的RET技术。

OPC技术通过对掩模版图进行修正，调制透过掩模光波的振幅分布，进而补偿前文提到的OPE效应［1］。图3给出了OPC技术的原理示意图。图3（a）左侧为掩模优化前的成像过程，初始掩模图案与目标图形（即预期在晶圆处获得的理想成像）相一致，但是成像产生了明显的扭曲。在图3（a）右侧，采用OPC技术对掩模图案进行预畸变或在掩模上添加细小的亚分辨率辅助图形（SRAF），能够有效补偿OPE所引起的成像误差，使晶圆上的成像质量得到改善［29-30］。图3（b）的左侧与右侧分别为OPC处理前后的掩模及其成像结果。根据修正方法的不同，OPC可分为基于规则的OPC（RBOPC）和MBOPC，而MBOPC又可分为基于边缘的OPC（EBOPC）和基于像素的OPC（PBOPC）。

图 3. OPC的原理示意图。（a）OPC优化前后的成像过程［2］；（b）OPC优化前后的掩模及其成像结果［15］

PSM通过改变相邻掩模图形透射光波的相位，在像面的特定区域产生相消干涉，以提高成像对比度和分辨率［16］。图4（a）为二值掩模（非相移掩模）的成像过程示意图，其中黑色代表不透明材料铬，白色代表透明材料石英。光波通过掩模及投影系统后在光刻胶上成像，来自相邻图形的光波将在暗场区域发生相长干涉，提高阻光区域的光强，降低成像对比度。如图4（b）所示，交替型相移掩模（Alt-PSM）在相邻的透光区域之间引入180°相移。目前常用的制作工艺是通过控制玻璃基板的刻蚀深度来引入相位差［31］。如图4（b）所示，对第一、第三和第五条平行线的镂空部分进行深度刻蚀，使之透过的光线与相邻线条透过的光线产生180°的相位差，从而在暗场区域发生相消干涉以提高对比度和分辨率。

目前业界常用的是衰减型相移掩模（Att-PSM）。Att-PSM采用半透明的硅化钼材料代替不透明的金属铬，使之允许6%的光强通过，同时在透射光中引入180°的相位差［32］。

图 4. 两种不同类型掩模的成像过程示意图。（a）二值掩模；（b）Alt-PSM［2］

自20世纪90年代起，OAI技术被提出并开始用于提升光刻系统的成像分辨率［33］。光波透过掩模后发生衍射，由于投影物镜的衍射受限特性，对于在轴照明来说，投影透镜仅能收集到0级和±1衍射光，形成三束光成像［4］。但是0级衍射光无法形成干涉条纹，只能对背景光强产生贡献，因此不利于提高成像对比度。随着掩模图形线宽的减小，不同级次的衍射光线将更加分散，在轴照明系统将更加难以收集高级次的衍射光，致使成像质量下降。OAI的光源位置偏离主光轴，入射光线和0级衍射光都与主光轴存在一定夹角，投影物镜可收集到0级与+1级（或-1级）衍射光，形成两束光成像，从而保留了更多的高级次衍射光能量，有利于提升成像分辨率和焦深（DOF）［7］。

图5展示了四种不同的照明方式，其中白色表示发光区域，黑色表示阻光区域。图5（a）为传统的圆形照明，它不属于OAI光源；图5（b）和图5（c）为二极照明；图5（d）和图5（e）为四极照明；图5（f）为环形照明。一般情况下，需要根据掩模图形结构来设置照明方式。对于单方向线条图案，可选取垂直于线条方向的二极照明；对于包含相互垂直的多线条图案，可选取四极照明；对于包含不同方向多边形的二维图案，一般选取环形照明。

图 5. 传统照明以及常见的OAI［2］。（a）传统圆形照明；（b）（c）二极照明；（d）（e）四极照明；（f）环形照明

03 计算光刻的基本原理

随着集成电路制程进入90~45 nm及以下的“深亚波长”技术节点，器件的最小线宽已经远远小于曝光波长，采用简单而基本的RET技术已无法保证光刻成像质量和工艺窗口满足要求。集成电路厂商在此时引入了MBOPC技术，以补偿光刻成像误差，确保芯片的制造良率。MBOPC技术率先使用数学模型和数值算法求解掩模图形的优化问题，从而催生了计算光刻技术［2］。20世纪90年代，衍射光学元件（DOE）被引入光刻照明系统中。DOE将入射平行光的一部分折射到指定位置，形成特定的光源照明条件［34］。随后人们提出了可编程照明系统FlexRay，并将其应用于高NA的浸没式光刻系统中。FlexRay通过操纵微反射镜的偏转角来获得指定的光源形状，有效地提升了照明设计的自由度［35］。这些技术为实现像素化的自由形态光刻照明奠定了硬件基础，促进了SO和SMO两种计算光刻技术的发展，并将光刻成像误差的补偿能力提升到了一个新的高度。

随着硬件实现能力的增强，光刻系统参数的优化自由度不断提高，RET技术也突破了传统的基于经验的设计思路和方法，向着数值化、模型化、解析化、算法化的方向发展。这使得像素化的光源和掩模优化［8，36］、像素化偏振态优化［37］、自由形态光瞳波前优化［38］等技术被相继提出和研究。而将图形误差逆向补偿的技术原理与计算科学深度融合，已成为计算光刻未来发展的必然趋势。下文将具体介绍计算光刻的基本原理和常用技术方案。

3.1 计算光刻的基本概念

计算光刻是集成电路制造端的关键EDA仿真技术，它采用数学模型对光刻成像过程进行仿真模拟，并对光刻系统的光源形状、掩模图案、照明偏振态、光瞳波前相位等系统参数，以及其他各项工艺参数进行独立或联合优化，以达到提升光刻成像质量，扩大工艺窗口，提高芯片制造良率的目的［2］。例如OPC技术的优化变量是掩模图形，而SMO技术的优化变量包括光源形状和掩模图形。

目标函数用于在优化过程中实时监测成像质量，使算法能够通过不断迭代更新变量，逐步提高成像性能。通常，目标函数可包括光刻成像的图形误差（PE）、边缘放置误差（EPE）、对比度、归一化图像对数斜率（NILS）等像质评价指标［1］。这些像质评价函数需要通过光刻成像模型计算得到，因此光刻成像模型是计算光刻优化仿真的重要基础。光刻成像模型的精度关系到目标函数f(x)是否能够精确地反映实际成像性能与优化变量之间的关系，在很大程度上决定了算法是否能够获得正确的优化结果。

限制条件用来限定优化变量的取值范围，使最终的优化结果满足实际需求。在计算光刻问题中，限制条件主要体现在物理可实现性和制造约束等方面。例如，光源的强度分布必须是非负数（因为光强值不可能为负数），优化后的掩模图案必须满足可制造性条件等［40］。

计算光刻的算法种类繁多，目前最常用的是基于梯度的迭代优化算法。梯度迭代算法是一种常见的数值优化求解方法［26，41］。这类算法的大体流程具有一定的相似性，它们都是从优化变量的某一个初始值开始迭代的。迭代过程中，算法基于目标函数、变量限制条件，以及目标函数的一阶导数和二阶导数，不断地更新优化变量值，形成对最优结果的渐近估计。最后，当满足某种收敛条件时，算法终止并输出优化结果。不同迭代算法的主要区别在于更新优化变量的具体策略不同。常见的梯度迭代算法包括：最速下降法（SD）［42］、共轭梯度法（CG）［43］、拟牛顿法（QN）［44］和随机梯度下降法（SGD）［45］等。除此以外，计算光刻算法还包括遗传类算法［46］、压缩感知（CS）算法［47］、机器学习［48-49］和深度学习算法［50-51］等。这些算法各具优势，并在某些问题的求解上体现了很好的性能。

基于上述分析，我们不难理解计算光刻技术的发展与创新主要是围绕“建模”和“算法”两个方面展开的。无论是模型的构建还是算法的研发，都面临着精度和效率之间的相互制约与权衡。模型需要尽量精确地刻画光刻成像的全链路过程，并尽量全面地考虑各种因素对成像质量的影响。一方面，模型不能过于近似和简单，否则将会损失过多的物理信息，导致模型精度下降，最终影响优化结果的正确性。另一方面，模型也不能过于复杂，否则将导致计算量过大，直接影响算法的实施效率。

在给定数学模型的基础上，需要发展合适的数值算法对优化问题进行求解。算法设计必须考虑到时效性、准确性和稳定性。时效性是指算法需要具有足够高的运算效率，能够在尽量短的时间内收敛，并完成优化任务。准确性是指算法应保证其收敛结果为最优解或较优解，并且对数据误差、舍入误差等具有一定的抗干扰能力。换句话说，优化结果必须能够有效补偿光刻成像误差，使其满足曝光要求。稳定性是指算法要具有一定的泛化能力，当电路版图的结构和尺寸产生变化时，仍然能够具有很好的性能表现。

3.2 光刻成像模型简介

3.2.1 光刻空间像模型

在光刻系统中，光源发出的光通过照明系统，均匀地照射到掩模版上。光线透过掩模发生衍射，并携带了掩模图案信息，再经过投影物镜收集后，在晶圆表面发生干涉成像，形成一定的光强分布，即所谓的空间像［4］。光刻系统的成像原理如图6所示。常用的光刻空间像模型包括标量模型和矢量模型。其中，标量模型仅考虑光波的强度特性，而不考虑光波的矢量特性（即偏振态），其精度仅适用于小NA（<0.6）的光刻系统成像仿真。当光刻系统的NA值大于0.6时，尤其是对于超大数值孔径（>1）的浸没式光刻系统，标量模型中的傍轴近似不再成立，同时偏振特性对成像结果的影响已无法忽视。此时必须采用矢量模型方能精确地描述光刻系统的成像过程［52］。

图 6. 光刻系统的成像原理示意图［52］

投影光刻系统一般采用部分相干照明，其有效光源可以分解成一系列非相干的点光源。考虑到光波的矢量特性，光刻系统空间像的阿贝模型可以表示；真实的光刻掩模具有三维立体结构，其衍射近场的振幅和相位与二维透过率函数并不一致，此时可以采用严格电磁场仿真方法或近似的厚掩模模型来求解。

3.2.2 光刻掩模模型

掩模版是光刻成像的对象，因此掩模模型是晶圆成像仿真结果的重要影响因素。以DUV光刻为例，其掩模结构主要分为三层：起承载作用的基底，由多种形状的阻光和透光区域组成的图形层，以及阻挡微粒等污染源的保护膜［4］。如图7（a）所示，当曝光波长远大于掩模图形的CD时，可以采用基尔霍夫薄掩模近似［4］。如图7（b）所示，对于45 nm及以下技术节点，掩模图形的CD与曝光波长处于同一量级，甚至小于曝光波长。此时薄掩模近似条件不再成立，必须采用厚掩模衍射近场模型，考虑掩模的三维结构对透射光波振幅、相位和偏振态的影响［53］。

图 7. 薄掩模模型和厚掩模模型对比。（a）光刻掩模基尔霍夫近似；（b）厚掩模衍射近场模型［53］

采用严格电磁场仿真方法，通过精确求解电磁波在厚掩模中的传播问题，可以获得厚掩模的精确衍射近场。常用的严格电磁场仿真方法包括：时域有限差分法（FDTD）［54］、严格耦合波分析法（RCWA）［55-56］、有限元法（FEM）［57］和波导法（WG）等［58］。但是此类方法计算量庞大，无法适用于大面积掩模的成像仿真和计算光刻优化问题。因此，研究人员提出了多种近似的厚掩模模型和快速衍射近场计算方法，在计算精度与运算效率之间寻求平衡。典型的快速衍射近场计算方法包括：边界层法（BL）［59］、区域分解法（DDM）［60］、修正因子拟合法［61-62］、结构分解法［63］、机器学习方法［64-65］和深度学习方法［66-67］等。

3.2.3　光刻胶模型和刻蚀模型

光刻系统在晶圆表面形成空间像，经过光刻胶的曝光、显影和后续的刻蚀等过程，完成掩模版图的复刻。目前常用的光刻胶一般由聚合物、光敏化合物或光致酸产生剂、溶剂以及一些特殊功能的添加剂组成［1］。在光刻过程中，光刻胶需要经过涂胶、匀胶、曝光、烘烤和显影等工艺步骤，同时将发生相应的物理或光化学反应。用来描述光刻胶效应的常用模型包括严格物理模型和简化的紧凑模型。

严格模型采用偏微分方程组，精确描述光刻胶在曝光、显影过程中所产生的一系列物理和化学变化，能够精确计算光刻胶显影后的形态［4］。研究人员已经对光刻胶的反应过程进行了深入研究，并建立了严格的光刻胶模型［68］。但是严格模型计算复杂，导致运算效率低下。因此，在计算光刻的优化算法中往往使用更为简单的紧凑模型。与严格模型相比，紧凑模型所用的参数少、计算过程简单，在提升运算速度的同时也能获得足够的精度。目前，常用的紧凑光刻胶模型包括CM1（compact model 1）模型［69］、可变阈值光刻胶（VTR）模型［70］、硬阈值模型［71］等。

经过曝光和显影后，特定区域的光刻胶将被清洗掉，在光刻胶上获得电路图案，同时露出下方的部分衬底。然后，采用刻蚀工艺可以将光刻胶上的图形转移至衬底上。刻蚀工艺主要分为湿法刻蚀和干法刻蚀［74］。湿法刻蚀使用纯化学方法进行刻蚀，该方法均匀性较差、精度较低，通常用于处理微米级电路版图。干法刻蚀主要利用等离子体或离子束轰击衬底来完成刻蚀。一般而言，刻蚀后衬底上得到的图形尺寸与光刻胶图形（作为刻蚀时的硬掩模）的尺寸是有差别的，而且这种差别在先进技术节点中更加显著。由于刻蚀后的结果与器件尺寸更接近，所以刻蚀偏差是计算光刻中必须考虑的关键指标。为了准确地预测刻蚀偏差，研究人员提供了多种刻蚀工艺模型，主要包括物理模型和经验模型等［4，75］。

物理模型是根据加工对象及工艺条件，综合分析刻蚀过程中的物理反应机理和各种工艺因素对加工结果的影响，利用数学物理方程描述其反应原理和反应过程，通过对方程求解，得到所需的工艺参数和结果。该方法能够准确地描述刻蚀过程和刻蚀轮廓的演化，但是需要明确刻蚀过程的物理原理，计算难度较高。此类模型根据对物理过程描述方法的不同可以分为复杂物理模型和简化模型，前者包括：表面动力学模型、连续元胞自动机模型等［76-77］。后者包括：沉积和刻蚀反应模拟器［78］、混合等离子体模型等［79］。

经验模型法也被称作黑箱模型，在很大程度上忽视了基本的物理过程。该模型基于实际测量的输入和输出并利用拟合方法建立出刻蚀的数学模型，常用拟合方法有：最小二乘法、主成分回归、神经网络等［80］。该类模型依赖于实验数据，对物理过程缺乏深刻理解，但在实际制造中容易应用。

3.3 计算光刻的数学模型

根据3.2节介绍的模型，可以计算出光刻成像质量的评价指标，并以此为依据构建优化目标函数。常用的像质评价指标包括：PE、EPE、成像对比度、NILS、掩模误差增强因子（MEEF）、工艺窗口和重叠工艺窗口（overlapped PW）等［1］。

EPE定义为光刻胶成像轮廓与目标图形轮廓之间的相对位置偏差。EPE越小意味着曝光后的图形和目标图形越接近。一般来说，EPE的数值与所选择的边缘观测点有关，如图8所示，为了全面地衡量成像的整体边缘位置偏差，可对所有轮廓点上的EPE数值进行积分并做归一化，得到平均EPE。

图 8. PE和EPE的示意图

工艺窗口是指在满足成像性能的条件下，曝光量和焦面位置的允许变化范围，这个范围分别用曝光裕量（EL）和焦深（DOF）表示。在计算工艺窗口时，最常用的成像指标是CD误差，有时也会采用NILS、光刻胶三维侧壁角、光刻胶损耗等指标［81］。在满足成像精度的条件下，EL表示允许光源实际曝光量相对于额定曝光量的最大偏差，通常用百分比表示；DOF表示允许焦面离焦的范围［81］。

在图9（a）和图9（b）中，上下两条曲线之间的封闭区域包含了所有满足要求的“曝光剂量-离焦值”组合，而这一区域中的最大内接矩形和最大内接椭圆分别被称为矩形工艺窗口和椭圆工艺窗口［4］。在实际的光刻工艺中，通常也会在给定EL的前提下（如EL为5%），寻求最大的DOF值，用以衡量工艺变化稳定性。该值越大，则工艺窗口越大［4］。对于一个包含多个关键图形的电路版图，往往需要确定多个测量位置，并在所有的测量位置上做工艺窗口分析，再把结果画在同一个“曝光剂量-离焦值”坐标系中。由于每一个测量位置上的工艺窗口不完全一样，它们互相重合的部分就是这些关键图形的重叠工艺窗口［82］。

图 9. 工艺窗口示意图［82］。（a）矩形工艺窗口；（b）椭圆工艺窗口

根据像质评价指标的定义不难看出，计算光刻的优化目标函数与空间像或光刻胶成像有关，而空间像和光刻胶成像又是各项系统参数和工艺参数的函数。因此，目标函数值由光源、掩模及其他系统参数和工艺参数决定。计算光刻模型将这些参数作为优化变量，通过算法获得最优的参数组合，以达到提升光刻成像性能的目的。

图 10. 计算光刻问题的变换和求解过程［83］

3.4 计算光刻基础算法简介

根据3.3节的方法构建数学模型后，便可采用数值优化算法来求解计算光刻问题。通常很难找到一种在所有计算光刻问题上均具有卓越性能的万能算法。目前，常用的计算光刻算法包括：梯度迭代算法、启发式算法、压缩感知算法、机器学习算法、深度学习算法等。

3.4.1 梯度迭代算法

梯度迭代算法是一类非常有效的计算光刻算法，被广泛地应用于专业软件的OPC和SMO模块中［84］。常用的梯度算法包括：SD算法［30］、CG算法［43］、SGD算法［45］、QN算法［44］和水平集算法［85］等。

SD算法在每次迭代中仅采用当前的梯度信息更新优化变量。该方法实现较为简单，经常用于参数优化的原理性探索，但其收敛速度较慢，通常只能得到近似最优解［86］。CG算法同时使用了当前梯度信息和历史梯度信息来指引优化变量的迭代更新，其收敛性能优于SD算法［87］。但SD和CG两种算法需要计算目标函数对于所有变量的偏导数，在处理大规模数据时耗时较长，优化效率较低。SGD算法在每步迭代时从众多优化变量中随机选择一个进行更新，因此只需计算目标函数对该变量的偏导数即可。通常情况下，SGD算法计算效率较高，但求解精度受限［88］。上述三种算法仅需要计算目标函数的一阶导数，因此计算复杂度相对较低。目前，这些算法已经在计算光刻领域获得了应用。

作为SD算法的推广，QN算法联合利用一阶导数和近似的二阶导数对优化变量进行更新。因此，该算法能够实现超线性的收敛速度，大幅提升了优化效率［89］。此外，与直接计算目标函数二阶导数的经典牛顿法相比，QN算法的计算复杂度显著降低。常用的QN算法有BFGS算法［90］、DFP算法［91］等。鉴于QN算法在收敛性能和计算效率上的优势，该算法已被广泛地应用于实际的计算光刻软件。

另外，水平集算法也常被用来实现光刻掩模和光源的优化，并在求解逆向光刻技术（ILT）问题时展现出了良好的性能［92］。该算法由Osher等［93］于1988年提出，通过引入流体力学的思想，解决了闭合曲线在发生形变时的几何拓扑变化问题。该方法将曲线的演化过程转换为偏微分方程来求解，使得计算结果更加稳定。在ILT问题中，构造一个三维水平集函数，使其零水平集对应于掩模图形的轮廓。通过梯度信息优化水平集函数，可以不断地更新零水平集和掩模图形轮廓，得到满足目标函数的优化结果［94］。

3.4.2 启发式算法

计算光刻中的常见的启发式算法包括：遗传算法（GA）［95］、粒子群优化（PSO）算法［96］、模拟退火（SA）算法［97］等。GA算法通过模拟自然进化的过程来搜索最优解，它将可行解视为染色体，通过交叉、变异、复制等操作不断进化种群个体，能够以较大的概率找到全局最优解。此外，GA算法具有较强的鲁棒性，但收敛速度较慢［98］。PSO算法通过设计一种模拟鸟群捕食行为的粒子群来实现优化，每个粒子通过共享个体极值信息和当前的最优解来调整各自的速度和位置，通过不断迭代使所有粒子逐渐聚集并收敛到最优解［99］。SA算法的基本思想来自于固体退火原理。该算法在迭代搜索中引入随机因子，每次都以一定的概率向更差解的方向移动，从而跳出当前的局部最优点，以期获得全局最优解［100］。

3.4.3 压缩感知算法

近年来，随着像素化光源和像素化掩模的引入，计算光刻的数据处理量大幅提升，严重影响了计算效率。为此，研究人员提出了基于CS的快速计算光刻算法［47］。CS算法首先假设待优化的光源和掩模图形能够在某组基函数上进行稀疏展开（又称为稀疏性假设）。之后，CS方法通过对电路版图的降采样来压缩优化模型的数据维度，并将计算光刻优化问题构造为lp范数（0≤p≤1）的最小化问题。通过在优化模型中加入稀疏正则项，可以采用CS重构算法获得优化后的光源和掩模图形。CS算法能够在提升光刻成像性能的同时，大幅提高计算效率。本文将在5.2节对压缩感知快速计算光刻技术进行详细介绍。

3.4.4 机器学习和深度学习算法

为了克服传统算法效率低下的问题，近年来研究人员开始将机器学习和深度学习技术引入计算光刻领域，为发展新型的快速仿真技术提供了思路。机器学习和深度学习模型在经过训练之后能够代替繁复的迭代计算过程，极大地提高了算法效率。因此，这类方法已成为计算光刻技术的未来发展趋势之一。

目前，已应用于计算光刻领域的机器学习方法包括：多层感知机（MLP）［101］、支持向量机（SVM）［48］、非参数核回归（NKR）［102］等。初步研究表明，这些算法不但能够提高计算效率，而且有望获得较高的仿真精度和成像质量。

相比传统的机器学习，深度学习具有更加强大的数据处理、特征提取和非线性预测的能力［103］。目前，计算光刻领域所采用的深度学习模型包括：卷积神经网络（CNN）［104］、全卷积网络（FCN）［67］、生成对抗网络（GAN）［105］、变分自动编码器（VAE）［50］、模型驱动卷积神经网络（MCNN）［106］和图卷积神经网络（GCN）［107］等。前期研究表明，深度学习技术在运算速度和仿真精度等方面展现了优秀的性能。

04 常用的计算光刻技术及其应用

4.1 OPC技术及其应用

传统的OPC技术发端于180 nm技术节点。OPC技术的发展经历了RBOPC和MBOPC两个阶段［12］，而MBOPC又可分为EBOPC和PBOPC两种技术［108］。例如，图11（a）中的目标图形为一对平行线条，其对应的RBOPC、EBOPC和PBOPC结果分别如图11（b）、图11（c）和图11（d）［109］所示。

图 11. 不同类型的OPC方法。（a）目标图形；（b）RBOPC结果；（c）EBOPC结果；（d）PBOPC结果［109］

4.1.1　RBOPC技术

RBOPC技术首先需要建立掩模修正规则表格，然后通过查表的方式，对掩模中的线边缘位置、线端、拐角等局部结构进行修正［14］。修正规则可根据工程经验制定，或者根据实验和仿真数据拟合得出。RBOPC技术的优势在于运算速度快，并且优化后的掩模图形较为简单，便于加工制造。但其仅能对局部的OPE进行补偿，无法获得掩模优化问题的全局最优解，限制了成像分辨率和成像精度的进一步提升。因此，RBOPC常用于250 nm和180 nm技术节点。对于更先进的节点，可以将RBOPC和其他OPC技术混合使用，以满足成像质量的要求。图12［110］给出了RBOPC的优化结果和修正规则表格示例。

图 12. RBOPC的优化结果和修正规则表格示例［110］

目前，常用的商业计算光刻软件，如KLA-Tencor公司的ProlithTM和Synopsys公司的S-LithoTM软件，也集成了RBOPC模块［111-112］。利用这些软件分析OPC结果，可以制定出较好的掩模修正规则。

4.1.2　MBOPC技术

随着光刻技术节点推进到90 nm及以下，RBOPC技术已无法满足高分辨、高保真的光刻成像要求。此时，业界开始广泛使用MBOPC技术对掩模图形做更为精准的修正。MBOPC是较早引入计算光刻理念的分辨率增强技术。该技术基于光刻成像的物理模型，对OPC问题进行数学建模，并采用数值优化算法修正掩模图案，相比RBOPC能够获得更高的成像分辨率和保真度。

1）EBOPC技术

早期的MBOPC技术仅对掩模图形的边缘进行移动，称为EBOPC技术。其原理是将掩模图形的边缘轮廓分割为若干片段，然后循环优化各个片段的位置，沿边缘的法线方向，将片段向外凸出或向内缩进，从而补偿光刻成像误差。与RBOPC相比，EBOPC具有更高的优化自由度，可以在迭代中不断监测光刻成像的EPE，并对所有边缘片段的位置进行联合优化，获得全局最优解。EBOPC的掩模优化结果具有阶梯状的图形边缘，虽然相比RBOPC掩模更为复杂，但其制造难度和成本可控。另外，EBOPC采用迭代优化算法，计算复杂度高于RBOPC，但目前成熟的EBOPC算法仍然能够在可接受的运行时间内获得全芯片或大面积掩模版图的优化结果。图13［113］展示了一个典型的EBOPC优化过程，以及优化后的成像结果。

图 13. EBOPC方法。（a）EBOPC的优化过程；（b）优化后的成像结果［113］

2007年，Chen等［114］采用牛顿法进行EBOPC优化，利用适当的OPE半径来控制牛顿法中雅可比矩阵的稀疏性，加快了掩模校正的速度，同时保证了成像质量。同年，Cai等［115］将RBOPC和EBOPC相结合，提出了自适应OPC方法，对掩模中的关键图形采用EBOPC技术优化，对于非关键图形采用RBOPC优化，取得了较高的成像精度和优化效率。随后，Li等［116］提出了基于遗传算法的混合OPC技术，采用RBOPC方法优化SRAF的大小和位置，然后采用EBOPC方法计算掩模布局的最优解。2008年，Gao等［117］利用主成分回归模型预测了掩模图案边缘片段的移动，在降低成像EPE的同时，减少了优化迭代次数。杨祎巍等［118］和沈泫等［119］针对拐角图案成像中的纹波效应，发展了基于动态自适应切分的EBOPC方法和基于空间曲线极值点的EBOPC方法。之后，杨祎巍等［113］利用映射模型对特征区域内的边缘片段进行移动优化，提升了EBOPC的计算速度，并得到了较高的校正精度。Huang等［120］提出一种针对拐角圆化的EBOPC方法，通过在拐角的凸顶点处加入斜向矩形来补偿顶点圆化的现象。

商业计算光刻软件通常带有EBOPC优化模块。例如，西门子EDA公司的Calibre软件提供了两种EBOPC功能：OPCpro（Sparse OPC）和nmOPC（Dense OPC）［4，121］。OPCpro一般适用于较大的技术节点（如130~65 nm），迭代过程中需要计算并控制光刻成像的边缘误差，使其尽量接近目标图形。而nmOPC一般适用于较小的技术节点（如65~20 nm），在20 nm节点可以结合双图形技术使用，能够获得更高的图形保真度。

2）PBOPC技术

为了进一步提高45~22 nm及以下节点的光刻成像性能，必须对掩模图案做更为复杂和精细的修正。此时，业界开始研究并逐步使用PBOPC技术。PBOPC首先将掩模版图栅格化为像素阵列，然后对每一个掩模像素的透过率进行优化。与EBOPC相比，PBOPC进一步提升了优化自由度，掩模优化结果可具有自由曲线的轮廓边缘［122］。从目标图形出发，采用逆向优化算法对掩模进行像素级修正的OPC技术，又被称为ILT［24］。

PBOPC不仅能够修正掩模的主体图形，而且可以在主体图形周围添加必要的SRAF。其中，主体图形是指面积较大且与目标图形具有较多重叠部分的掩模图案，而SRAF是与主体图形分离且小于分辨率极限的掩模图案。在成像过程中，SRAF本身并不在光刻胶上形成图像，但其透射和散射的光线可以对主体图形的成像产生贡献，改善掩模图案的局部周期特性，补偿成像误差，扩大工艺窗口［123］。事实上，早在90~45 nm技术节点，工艺线就已经开始引入SRAF作为提升工艺窗口的有效手段。但当时所采用的SRAF生成方法大多是基于经验和基于边缘的，思路类似于RBOPC和EBOPC技术。

PBOPC算法需要对大量数据进行处理，计算代价高昂，通常不会直接用于全芯片掩模的整体优化。一种可行的做法是采用RBOPC或EBOPC对掩模做整体优化，然后检测坏点，即那些难以满足工艺窗口要求的局部区域，再采用PBOPC对局部坏点做精细优化［124］。另外，直接由PBOPC获得的像素化掩模图案通常较为复杂，难以加工制造。为了提高掩模的可制造性，一般会采用掩模规则检测（MRC）方法对掩模图案进行规整化处理［125］。MRC可以控制主体图形与SRAF的尺寸、边缘形貌和间距，以获得易于制造的掩模图案。

前期，相关学者和业界专家提出了一系列PBOPC算法。1992年，Liu和Zakhor［126］提出了基于分支界限法和模拟退火算法的掩模修正方法，提高了光刻成像性能。1995年，Sherif等［127］将非相干衍射受限成像系统下的掩模优化问题表述为混合整数线性规划问题，并使用分支界限算法进行求解。2006年，Granik［128］采用局部变分梯度下降法求解了非线性的掩模优化问题，在保证成像质量的同时，节省了优化时间。同年，Pang等［129］总结了之前的ILT方法，并通过模拟仿真论述了ILT的优势。随后，Pang等［130］提出了基于水平集的ILT算法，能够同时优化主体图形和SRAF，提升了成像保真度。2007年，Poonawala等［30］提出了基于SD算法的PBOPC技术。该方法使用连续的S形函数模拟光刻胶效应，并利用全变分惩罚项约束了掩模的复杂度，有效提升了光刻成像质量。图14［30］展示了该算法的仿真结果。

图 14. 基于SD算法的PBOPC仿真结果。（a）目标图形；（b）优化后的灰度掩模；（c）优化后的二值掩模；（d）~（f）对应于第一行掩模图形的成像结果［30］

2007年，Ma和Arce［131］提出了一种基于梯度的多相位PSM优化方法，利用指数函数对掩模相位参数进行松弛，克服了传统方法仅能优化双相位PSM的不足，获得了较高的成像质量。该团队还提出了一种小波罚函数法，可用于有效降低掩模优化图案的复杂度。此后，该团队针对部分相干光刻成像系统，发展了基于SD和CG算法的ILT技术，并提出了一种MRC惩罚项，用于提升成像精度和收敛速度，降低掩模复杂度［43］。图15［43］给出了上述两种ILT方法的仿真结果。

图 15. 基于SD和CG算法的ILT方法对比。（a）目标图形；（b）采用SD算法获得的掩模优化结果；（c）采用CG算法获得的掩模优化结果；（d）~（f）对应于第一行掩模图形的成像结果［43］

2008年，Jia等［132］采用CG算法实现了掩模逆向优化，提高了成像焦深，之后又采用SGD算法对掩模特征进行了训练，实现了高效的PBOPC优化［45］。同年，Chan等［133］将CG算法与有效集法相结合，对PSM进行了像素级优化，并在此基础上采用动态规划方式实现了Alt-PSM的初始化，以进一步提升成像保真度和对比度［134］。2009年以来，Shen和Shi等进一步扩展了前人的工作，针对掩模逆向优化分别提出了基于有限差分法的水平集方法、基于正则化的水平集方法［135］，以及结合共轭梯度的水平集方法［136］。此外，前期研究还提出了考虑部分相干成像系统［137］、矢量成像模型［138］，以及工艺变化带宽［139］等条件的水平集方法，获得了较高的成像保真度、鲁棒性、收敛速度和掩模可制造性。随后，Shen等［140］提出了基于半隐式加性算子分裂（SIAOS）方法的PBOPC算法，改善了掩模优化的收敛性。图16［140］为该方法与SGD方法的优化结果及收敛曲线对比。

图 16. 基于SIAOS和SGD的PBOPC方法对比。（a）掩模和成像优化结果；（b）收敛曲线［140］

2010年，Yu等［141］研究了目标函数中不同惩罚项对ILT优化结果的影响。2012年，研究人员又针对45 nm及以下技术节点的浸没式光刻系统，发展了基于矢量成像模型的高精度PBOPC算法［36，142］。2014年，Lv等［143-145］先后提出了基于瀑布式多重网格、掩模滤波和基函数表征的PBOPC算法，以达到提升效率、成像精度和可制造性的目的。

2015年，Global Foundries的Lutich［146］提出了一种针对全芯片版图的SRAF快速插入方法，保证了光刻成像性能。同年，IBM公司Ionescu等［147］提出了基于稀疏掩模表示的ILT算法，提升了光刻成像性能与掩模可制造性。2016年，Wang等［148］采用PSO算法对掩模进行了像素级的逆向优化。2017年，Yenikaya［149］提出了基于模式匹配和层次结构重构的PBOPC方法。2018年，Choi等［150］将具有多图形和蚀刻感知的ILT技术应用于金属层版图的优化，解决了线路蚀刻后潜在的挤压和桥接问题。Azuma等［151］提出了一种制程差异感知的PBOPC方法，利用二次规划算法提升了目标图案边缘轮廓处的光强对比度，随后又将拉格朗日松弛法引入目标函数中，采用梯度算法求解，提升了光刻成像的保真度［152］。

2019年，Su等［153］提出了一种基于ILT的SRAF提取与插入方法，保证了SRAF放置的可靠性，缩短了开发周期。此外，Gao等［154］提出了一种基于ILT的SRAF删除方法，以解决由掩模制造约束引起的SRAF冲突。2020年，Nikon公司的Okudaira等［155］将PBOPC问题描述为一个二次无约束的二值优化问题，并采用量子计算方式进行快速求解。2021年，Chen等［156］提出了基于虚拟边缘和掩模像素两步采样的PBOPC算法，提高了优化效率。同年，Yu等［157］采用Adam算法进行掩模逆向优化，并利用梯度的一阶矩和二阶矩来调整每个像素的学习率以提升算法的收敛速度，扩大了工艺窗口，图17［157］为该方法的优化结果。

图 17. 基于Adam和SGD算法的ILT优化结果对比。（a）目标掩模；（b）基于Adam算法的掩模优化结果；（c）基于SGD算法的掩模优化结果；（d）两种算法的收敛曲线；（e）基于Adam算法的光刻成像；（f）基于SGD算法的光刻成像［157］

目前，多种商业软件都包含了PBOPC的优化仿真功能，例如Synopsys公司的proteus-ILT设计仿真软件［158］、西门子EDA公司的pxOPCTM模块［159］、ASML公司的CTM+模块［160］等。采用这些软件可以对掩模版图进行精细修正。

综上所述，OPC技术逐步从基于规则的范式向模型化、数据化和算法化的方向发展，对光刻成像误差的补偿精度和分辨率的提升能力也在不断加强，但这也使得OPC技术的计算复杂度不断提升，优化后的掩模图形趋于复杂，对掩模的可制造性设计提出了更高的要求。

4.2 光源优化技术及其应用

早期光刻机采用的照明模式具有简单的几何形状。如图5所示，这些照明模式可以采用少量的几何参数加以定义，如圆形照明的半径（部分相干因子σ）、环形照明的内外相干因子和环宽、四极照明的开口角等，因此又被称为参数化光源模型。最佳的照明模式与掩模的特征图形尺寸、周期特性、线条延伸方向等因素密切相关。前人对传统照明的参数优化进行了大量研究［161-162］，此处将这类方法统称为参数化SO技术。

2010年左右，自由形态DOE［34］和可编程照明系统［35］被用于光刻技术中，实现了像素化的照明模式。照明系统硬件的进步促进了像素化SO（PBSO）技术的产生与发展。PBSO技术将光源图形栅格化为像素阵列，并对每个像素的光强值进行优化，最后可形成具有连续光强分布的自由形态光源。图18［163］为PBSO技术和参数化SO技术的优化效果对比，PBSO可以获得更高的成像对比度和更大的工艺窗口。目前该技术通常与OPC联合使用，形成完整的光源-掩模联合优化流程。

图 18. PBSO和参数化SO的优化结果对比。（a）掩模版图；（b）参数化SO得到的二极照明；（c）PBSO得到的光源优化结果；（d）空间像横截面；（e）工艺窗口［163］

众多学者和技术人员对SO问题进行了深入研究。2004年，Granik等［22］提出了基于非负最小二乘法的PBSO算法，并证实了PBSO技术在提升光刻成像性能方面的优越性。2005年，Fühner等［46］提出了基于GA算法的PBSO技术，提升了收敛效率，同时扩大了焦深。2009年，Tian等［164］针对22 nm的接触孔图形提出了一种光源的全局优化方法，并证明了关键图形对光源优化结果有很大影响。2010年，Peng等［41］将梯度算法应用于PBSO，有效提升了计算速度和成像对比度。2012年，Yu等［165］在优化模型中采用目标图形的二次轮廓函数来近似光刻胶成像，并用CG算法加快了SO的收敛速度。

2014年，Jiang等［166］提出了基于SA的PBSO算法，扩大了工艺窗口。Yan等［167］提出了基于二次规划的PBSO算法，降低了成像误差，具有较快的收敛速度。Lv等［163］提出了基于无梯度优化的PBSO算法，降低了成像CD误差，提升了NILS。Wang等［168］提出了结合PSO的PBSO算法，与传统的遗传算法相比，能够降低成像误差，加快收敛速度。同年，Tawada等［169］提出了基于网格点聚类的PBSO方法，减少了优化参数，使运算速度得以提升。2017年，ASML公司的Finders等［170］提出了一种基于EUV光刻衍射成像性质的SO方法，通过考察不同离焦处的空间像平移和对比度来调整光源形状，扩大了工艺窗口。随后，Liu等［171］提出了厚掩模条件下的SO方法，在降低成像误差的同时，提升了曝光裕量。为了进一步提高计算效率，研究人员还提出了基于CS的快速SO技术［172-174］。

4.3 光源掩模联合优化（SMO）技术及其应用

在28~22 nm及以下节点中，半导体器件的CD逐步逼近193 nm浸没式光刻机的分辨率极限，此时必须采用更加有效的计算光刻技术来提升成像分辨率和工艺窗口。SMO技术在这样的行业背景下应运而生。SMO组合了SO和OPC两种技术，通过联合优化光源结构和掩模图案，进一步提高了设计自由度，能够有效扩大关键区域的工艺窗口。早在2002年，IBM公司的Rosenbluth等［25］就提出了SMO的技术思想，并对光源和掩模的优化算法进行了初步研究，其优化结果如图19［25］所示。在此之后，众多研究者提出了不同的SMO优化策略和算法。ASML公司在其开发的NXT：1950光刻机中使用了像素化光源，为SMO技术的具体实施提供了硬件平台［35］。目前，SMO技术已经在22 nm及以下节点的集成电路量产中获得了非常成功的应用，现已成为先导工艺中不可或缺的计算光刻技术。

图 19. SMO技术及其对工艺窗口的提升［25］

在实际生产中，SMO往往和OPC联合使用。SMO算法的计算量较大，难以针对光源和全芯片掩模版图进行同时优化。业界采用的一个标准的全芯片SMO流程如图20［4］所示。首先从全芯片掩模上提取若干（例如数十个）典型的局部图形，通常包括根据设计规则所制定的测试图形，以及基于经验所得到的弱点和坏点图形等。考虑到针对全部典型图形的SMO优化仍然具有很高的计算量，需要从典型图形全集中筛选出少量的代表性图形，并将这些代表性图形和初始光源输入到SMO程序中进行初步优化。在这个步骤中，光源优化需要考虑到所有代表性图形的成像结果，进而获得代表性图形的掩模优化图案，以及与之相匹配的最优光源。之后，固定优化后的光源，并对除代表性图形以外的其他典型图形进行OPC优化。在该过程中，如果光源模式能够满足所有典型图形的成像指标要求，则可以继续对全芯片掩模进行OPC建模与修正。否则，需要进行新一轮的SMO优化，进一步改进光源，使其能够满足所有典型图形的成像要求。当然，在进入全芯片掩模的OPC优化流程后，同样有可能出现某些坏点无法满足工艺窗口要求的情况。此时，需要将新检测到的坏点区域加入到典型图形的集合中，并重复SMO优化流程，改善照明条件，直到掩模上所有的关键区域均满足成像性能要求为止［175］。

图 20. 面向全芯片版图优化的SMO工作流程［4］

现有的标准化SMO流程通常可以拆解为光源单独优化、掩模单独优化、光源-掩模同步优化，以及光源-掩模交替优化等基本的实施步骤［52］。其中，同步优化是指在每一次迭代中同时更新光源和掩模的优化变量，而交替优化采用“…掩模优化、光源优化、掩模优化…”的流程，在每一次迭代中只更新光源变量或掩模变量，通过不断切换优化对象实现算法收敛。对上述几种基本的优化步骤进行组合，可以实现混合型的SMO优化流程［52］。

前期，研究人员对比了同步型SMO（SISMO）、交替型SMO（SESMO）和混合型SMO（HSMO）三种算法的性能差异［52］。其中，SISMO能够有效利用光源和掩模之间的耦合关系达到协同优化的效果。SESMO利用光源优化和掩模优化的相互转化，易于跨越局部最优点，从而得到较小的收敛误差。HSMO融合了以上各种算法的优势，能够灵活控制光源和掩模的优化流程与参数设置，因此在成像精度和收敛速度方面具有更好的表现。图21［52］对比了SISMO、SESMO和HSMO三种算法的优化结果及收敛曲线。

图 21. SISMO、SESMO和HSMO三种算法的优化结果及收敛曲线［52］

多年来，SMO技术受到了产业界和学术界的广泛关注与研究。2002年，IBM公司的Rosenbluth等［25］提出了基于衍射级次的SMO方法，提升了光刻工艺窗口。2004年，Erdmann等［176］提出了基于GA算法的SMO技术，提高了掩模的可制造性，扩大了焦深。受限于当时的制造能力，早期的SMO方法大多采用相对规则和简单的光源结构。随着自由形态照明技术的发展，像素化光源被应用于SMO技术中，提高了算法的优化自由度和光刻成像性能。

2005年，ASML公司的Socha等［177］提出了基于掩模频谱优化的SMO方法，提升了工艺窗口和成像对比度。2008年，Luminescent公司的Pang等［178］在考虑MEEF的条件下，采用水平集算法求解了SMO问题。同年，ASML的Hsu等［179］设计了一种可以同时考虑工艺窗口和MEEF的SMO方法。2009年，Ma等［26］提出了基于点元翻转的像素化SMO（PBSMO）算法。该算法利用目标函数的梯度信息指引光源像素和掩模像素的同步优化，对二元掩模和相移掩模均得到了较好的优化结果。同年，Nikon公司的Nakashima等［180］采用SMO对45 nm节点的SRAM单元层进行优化，提升了工艺窗口和成像对比度。随后，Synopsys公司的Mülders等［181］提出了一种基于掩模分割的SMO方法，改善了工艺窗口和成像精度。2011年，Peng等［42］提出了基于SD的PBSMO算法，采用光源和掩模的交替优化方式，引入了光源复杂度惩罚项，提升了成像保真度。图22［42］展示了该方法的优化结果和收敛曲线。之后，研究人员将光刻系统的矢量成像模型和CG算法引入PBSMO优化框架，提出了HSMO的优化流程，有效提升了超大NA浸没式光刻系统的成像保真度和工艺窗口［182］。

图 22. PBSMO算法的优化结果及收敛曲线［42］

2011年，Samsung公司的Kim等［183］采用Tachyon SMO平台研究了针对逻辑电路的SMO方法，提升了复杂二维图形和密集接触孔等关键布局的工艺窗口。同年，Jia等［184］采用CG算法优化光源和掩模，提高了光刻成像的工艺变化稳定性。2012年，Li等［185］提出了坏点感知的快速PBSMO算法，通过在目标函数中引入权重矩阵提升关键区域的成像性能，同时提高了收敛速度。随后，Li等［44］和Wu等［186］分别提出了采用增广拉格朗日方法（ALM）和Zernike光源基函数的快速PBSMO算法。图23［44］对比了ALM和CG两种算法得到的SMO优化结果及平均工艺窗口。

图 23. ALM算法和CG算法的SMO优化结果对比。（a）~（f）ALM算法和CG算法得到的光源、掩模和成像优化结果；（g）两种算法得到的平均工艺窗口［44］

2013年，Li等［187］针对光刻系统的离焦、曝光量变化和像差等因素，采用像素翻转的方法进行了SMO优化，提升了成像对比度和保真度。2016年，Global Foundries和ASML-Brion的研究人员提出了考虑层间约束的SMO算法，用于保持足够的层间覆盖裕度，增大了工艺窗口［188］。同年，Mentor公司和Global Foundries公司的研究人员将厚掩模的区域分解模型和紧凑光刻胶模型应用于SMO技术，提升了优化结果的准确性，降低了工艺变化带宽［189］。Yang等［190-191］采用多染色体遗传算法求解了PBSMO问题，考虑了离焦和彗差对光刻结果的影响，降低了算法对工艺条件误差的敏感度。2018年，Shen［192-193］提出了基于窄带水平集和半隐式水平集的PBSMO算法，提升了成像质量和运算效率。图24对比了SD算法、传统水平集算法和窄带水平集算法的SMO仿真结果。2020年，Chen等［194］提出了一种基于协方差矩阵自适应演化策略的SMO算法，通过自适应地更新解空间和搜索步长，提高了成像性能。

图 24. 传统SD算法、传统水平集算法和窄带水平集算法的SMO仿真结果对比。（a）~（l）三种算法的光源、掩模和成像优化结果；（m）各种算