机器学习在纳米技术制造中的应用：从蚀刻精度到沉积预测

2025-01-09

摘要

将机器学习（ML）整合到纳米制造技术领域中，特别是在沉积工艺中的厚度预测和蚀刻过程中的图案保真度应用方面，可能展现出变革性的潜力。本文讨论了两种基于ML的方法，这些方法可提高这些关键过程的精度和效率。在蚀刻方面，我们重新审视了从光刻胶线条到基板的蚀刻诱导线边粗糙度（LER）转移的3D几何建模，并改进了之前的模型，以考虑实际的三维表面形貌。同时，在沉积部分，我们使用深度神经网络（DNN）来预测粗糙基板上沉积薄膜的厚度，所使用的数据来自二值化的从上至下扫描电子显微镜（SEM）图像。结果表明，基于ML的方法不仅能够预测，而且可能控制纳米制造参数，从而改善制造结果。

1 引言

纳米技术在推动从电子到材料科学等众多行业的能力提升方面至关重要。随着我们深入探索原子和分子尺度，用于操控这些微小结构的技术变得愈发重要。其中，蚀刻和沉积是制造纳米结构器件必不可少的技术。

蚀刻是一种减材工艺，其中材料从表面系统地去除以创建所需的图案或结构。该技术在用于集成电路和微机电系统（MEMS）的微加工中至关重要。蚀刻的精度不仅影响尺寸，还影响所得纳米器件的功能。

另一方面，沉积是一种增材制造工艺，其中材料被分层到基板上以构建所需的纳米结构。这可以通过各种方法来实现，例如化学气相沉积（CVD）、物理气相沉积（PVD）和原子层沉积（ALD），每种方法在材料特性和应用特异性方面都具有不同的优势。

传统上，蚀刻和沉积被视为制造过程中的离散步骤。然而，它们的相互依存性对于成功制造纳米结构器件至关重要。蚀刻工艺塑造的表面质量和特性直接影响后续沉积阶段的效率和质量。例如，蚀刻不良的表面可能会导致沉积工艺中出现分层缺陷，从而损害最终产品的电气、机械或光学特性。

机器学习通过实现高精度和高效率的先进数据分析和预测建模，已经彻底改变了众多科学和工业领域。

材料科学中深度学习技术的最新进展已经证明了深度学习在分析原子分辨率显微镜图像方面的潜力，能够实现精确的化学识别和监测材料中的局部转变。进一步的应用包括跟踪材料在电子束诱导转变过程中的缺陷和相演变。其他研究使用变分自编码器探索无序系统中的动态过程，说明了这些模型在捕获复杂序参量方面的潜力。机器学习在材料科学中的更广泛作用也体现在针对特定功能进行材料逆设计以及机器学习和大数据对新型材料发现和开发的总体影响上，这表明该领域正朝着更加数据驱动的方法转变。

此外，深度学习已被应用于进一步细化我们对生物分子结构和相互作用的理解。像AlphaFold这样的技术不仅以高精度预测蛋白质结构，而且已被开发用于更好地理解复杂的生物分子相互作用。其他工作讨论了通过深度学习势能增强蛋白质结构预测。同时，人们也在努力涵盖整个人类蛋白质组，在范围和准确性方面均取得了显著进步。此外，机器学习的潜力还扩展到生物技术领域，特别是在功能性蛋白质的设计方面，这可能带来该领域的创新性发展。在医疗保健领域的应用也在努力提高国际乳腺癌筛查计划的诊断准确性。

此外，深度学习和机器学习越来越多地融入专业科学领域，增强了理论和实际应用。例如，物理信息神经网络已显著提高了解决涉及复杂非线性偏微分方程的正问题和逆问题的能力，展示了这些工具如何弥合数据驱动模型与传统物理理论之间的鸿沟。在大气科学中，Aurora模型代表了一项将基础模型应用于大气的开创性工作，显示出在气候建模和预测方面取得重大突破的潜力。在粒子物理学领域，JUNIPR框架展示了如何创新地使用无监督机器学习来分析没有预定类别的数。同样，将深度学习应用于扫描电子显微镜图像的降噪标志着微电子学方面的重大进展，通过提高线边粗糙度的测量准确性来实现。此外，探索AI生成艺术与人类创作艺术的复杂性使用深度学习来探究视觉艺术中的潜在模式和熵，进一步将AI扩展到创意和解释性领域。最后，机器学习在社会科学中的应用展示了其多功能性和丰富方法论的潜力，为复杂社会现象提供了新颖见解]。

这些应用中的每一个都强调了机器学习的变革性影响，其益处已超越传统计算任务，解决了广泛学科中的复杂挑战。因此，本文深入探讨了两种基于ML的方法，旨在改进纳米结构器件的制造工艺。具体而言，我们探索了ML在沉积工艺中预测薄膜厚度和在蚀刻过程中准确传递图案的潜力，为优化这些关键制造步骤的精度和效率提供了新的途径。

首先，我们探索了机器学习（ML）在增强蚀刻工艺中的应用。传统的光刻胶边缘粗糙度（LER）转移几何建模对于理解光刻胶图案如何影响基板至关重要。通过整合光刻胶线条的现实三维模型，我们基于机器学习的方法可以预测并优化图案转移，全面考虑LER特性的全谱系。

其次，在沉积工艺中，挑战在于准确测量蚀刻后粗糙表面上沉积薄膜的厚度。我们利用在类似于二值化俯视图扫描电子显微镜（SEM）图像的合成数据上训练的深度神经网络（DNNs）来预测薄膜厚度。这种方法不仅提供了定量分析，还适应了蚀刻工艺产生的复杂地形。

论文的其余部分分为三个不同部分（2-4）。首先，第2部分详细描述了两种方法和相应的数据集。然后，第3部分展示了结果，并在第4部分进行了讨论。

2 方法与数据集

在本节中，我们分别在2.1和2.2中描述两个数据集，随后在2.3和2.4中为每个数据集描述相应的方法。

2.1 蚀刻数据集

在通过等离子蚀刻的图案转移过程中，该数据集包含10,000个样本，涵盖了转移前光刻胶线条和转移后基板线条的特征参数，这对于精确建模至关重要。在这里，我们将重点关注光刻胶轮廓形状和侧壁粗糙度对蚀刻诱导图案转移后基板线条后续侧壁粗糙度的影响。侧壁粗糙度在俯视图扫描电子显微镜图像上的二维投影称为光刻胶边缘粗糙度（LER），其控制是当前半导体行业中更为关键的问题之一。光刻胶线条的形状和粗糙度由以下几个指标表征：

（a）与光刻胶轮廓锐度相关的线条侧壁的平均斜率；

（b）光刻胶侧壁粗糙度的均方根（RMS）；

（c）描述侧壁分布峰值锐度的侧壁粗糙度的峰度；

（d）指示侧壁粗糙度分布不对称性的偏度；

（e）表示侧壁粗糙度值相关的距离的相关长度；

以及（f）粗糙度指数，它衡量高频粗糙度对总粗糙度的相对贡献，并与侧壁粗糙度的分形维数相关。相反，在本研究中，图案转移后形成的基板线条根据其侧壁粗糙度由三个参数表征：（a）RMS值；（b）相关长度；以及（c）粗糙度指数，这些参数的解释与光刻胶侧壁粗糙度的情况类似。这些参数共同为光刻胶和基板线条提供了全面的表征，从而促进了我们在特定环境中对图案转移过程的精确建模。

2.2 沉积数据集

在沉积的情况下，我们的数据集包含10,000张模拟图像，这些图像复制了二值化俯视图扫描电子显微镜图像。模拟采用形态膨胀算子来模拟沉积效应。数据集中的每个条目都包含一对图像：一张表示膨胀前（沉积前）的表面，另一张表示膨胀后（沉积后）的表面，以及详细说明应用膨胀量的元数据。这种设置模拟了沉积厚度，为训练我们的机器学习模型提供了受控环境，以便基于SEM图像预测沉积薄膜的量。

图1展示了数据集中随机选取的一组图像。

▲图1：使用扩张核等于4进行扩张前后的黑白图像对比

2.3 用于蚀刻的深度神经网络（DNN）

在图案转移的情况下，我们采用了一种利用Optuna超参数优化框架优化的动态可配置神经网络架构。该网络使用TensorFlow的Keras API构建，允许在优化过程中灵活调整其结构，以实现最佳性能指标。

神经网络由输入层、多个隐藏层和输出层组成。输入层的大小对应于训练数据集中的特征数量。隐藏层的数量是可变的，范围从一到五，具体由Optuna在优化过程中的试验建议确定。每个隐藏层包含50到300个神经元，使用修正线性单元（ReLU）激活函数，以引入模型的非线性。

各层应用了正则化技术，特别是L2正则化，以降低过拟合的风险。正则化强度以及各层的丢弃率（范围从0.1到0.5）也在试验过程中进行了优化。这些丢弃层对于减少神经元之间的相互依赖至关重要，进一步防止模型过拟合。

输出层使用softmax激活函数，适用于多类分类任务，其维度根据数据集中目标特征的数量确定。网络使用Adam优化器进行编译，其中学习率被视为一个超参数，以对数方式从1e-5到1e-1变化，由Optuna进行优化。

在训练过程中，我们采用了诸如早停和平原区学习率衰减等策略，这些策略基于验证损失性能进行设置。这种方法确保了模型不会过度训练，在保持泛化能力的同时优化了计算效率。

这种配置使神经网络能够有效地适应不同的数据集，优化不同训练场景下的均方误差，从而确保稳健的预测性能。

在使用Optuna进行的优化过程中，最终选择的最有效架构包含两个隐藏层。第一层包含118个单元，第二层包含193个单元，两者都使用ReLU激活函数引入非线性。网络采用系数为0.00368的L2正则化来减轻过拟合，第一层丢弃率为0.2337，第二层丢弃率为0.1308，以减少神经元间的依赖并进一步防止过拟合。模型使用学习率为0.000264的Adam优化器进行优化，确保高效收敛。Optuna确定这种架构在复杂性和预测准确性之间提供了最佳权衡，最小化了验证数据集上的均方误差。最后，需要注意的是，数据按80-10-10的比例分为训练集、验证集和测试集。

2.4 用于沉积的深度神经网络（DNN）

在沉积案例中，我们使用Keras和TensorFlow框架实现了一种基于迁移学习的神经网络，以预测图像变换，特别是关注图像中的膨胀效应。

我们的模型基础架构利用了预先在ImageNet数据集上训练的卷积神经网络VGG16。这一选择是基于VGG16在提取多样视觉输入的稳健特征表示方面的已证明能力。我们的网络架构从输入层开始，该层将传入的单通道图像调整为VGG16所需的三通道格式，在所有三个通道中复制灰度值和特定的二值。这种适应使预训练模型能够处理灰度图像，而不会丢失其所学特征的通用性。输入层之后，架构包含一个全局平均池化2D层，有助于降低特征图的维度，同时保留重要的空间层次结构。

对于回归任务（预测每张图像应用的膨胀量），网络在VGG16基础上附加了两个全连接层。第一个全连接层包含1024个神经元，使用ReLU激活，提供了从VGG16层转发的丰富特征集中学习的充足能力。最终输出层是一个具有线性激活函数的单个神经元，直接估计膨胀参数。

为了保持从ImageNet学到的特征的完整性，我们在训练过程中冻结了VGG16层的权重，仅允许新添加的层更新其权重。这种方法不仅加快了训练速度，还通过不改变基础模型经过良好优化的特征检测器来防止过拟合。

模型使用Adam优化器和均方误差损失函数进行编译，以适应任务的回归性质。训练采用基于验证损失的早停谨慎方法，以进一步对抗过拟合。网络基于其在保留测试集（数据比例为80-10-10）上的性能进行评估，并可视化结果，以评估模型在膨胀估计方面的预测准确性。

3 结果

在本节中，我们将描述应用上述方法所得到的结果。

3.1 蚀刻结果

我们的深度神经网络（DNN）架构的训练和验证过程中得到的结果通过两幅图（图2和图3）展示。第一幅图描绘了80个周期（epoch）内训练和验证数据集的损失曲线。起初，训练和验证损失都急剧下降，表明了一个快速的学习阶段。随着周期的增加，损失值趋于平稳，表明网络正向最优权重和偏置收敛。值得注意的是，验证损失紧密跟随训练损失，没有显著偏离，这通常表明模型避免了过拟合，对新数据具有良好的泛化能力。

▲图 2：训练损失与验证损失随训练轮次的变化图

第二幅图详细比较了训练和测试数据集的平均平方误差（MSE）和平均绝对误差（MAE）指标。训练数据的MSE记录为0.0062，而测试数据的MSE略增至0.0063，展示了模型在未见数据上的一致性能。MAE值显示出类似的趋势，训练数据的MAE值为0.0521，测试数据的MAE值为0.0537。从训练到测试，误差指标的这种微小增加进一步证实了模型的稳健性。

▲图 3：训练集和测试集的均方误差（MSE）和平均绝对误差（MAE）

这些发现证明了通过Optuna框架优化的神经网络配置的有效性。具有两个隐藏层、dropout和L2正则化的架构显然有助于网络学习可泛化的模式而不发生过拟合，这从训练和验证损失的紧密一致以及未见数据上的低错误率中得到了证明。这种性能支持了该DNN方法在半导体制造中的蚀刻等复杂模式识别任务中的实际应用，其中精度和可靠性至关重要。

3.2 沉积结果

我们的第二个深度学习模型从模拟的二值化俯视图扫描电子显微镜（SEM）图像中预测沉积厚度的性能，在训练和验证损失曲线（图4）中进行了定量总结。在20个周期内，训练损失从初始值约0.7迅速下降并稳定在略高于0.2的水平，表明模型高效学习和适应训练数据集。同时，尽管验证损失起始值稍高且波动较大，但它向训练损失收敛，表明模型具有良好的泛化能力且未发生过拟合。训练和验证损失之间的这种紧密收敛强调了模型的稳健性和在不同条件下可靠预测的能力。

▲图 4：训练损失与验证损失随训练轮次的变化情况

除了损失指标外，模型的预测准确性还通过其在测试图像上的表现得以体现，它展示了以极小误差量化沉积厚度的惊人能力。例如，预测值4.03、4.31和2.97分别与二值化沉积后图像中的实际值4.00、4.00和3.00紧密一致（图5）。这些结果不仅突出了模型在评估沉积材料程度方面的精确性，还强调了其在材料科学和半导体制造领域自动化分析中的潜在适用性。模型从SEM图像中辨别和量化沉积细微变化的能力，可以显著提高这些行业的运营效率和质量保证。

▲图 5：来自测试集的随机图像，显示沉积的预测值和实际值。

4 结论

本研究展示了在纳米技术制造过程中的关键阶段，特别是蚀刻和沉积阶段，应用基于机器学习（ML）技术的进展。在蚀刻领域，我们的研究采用了一种深度神经网络（DNN），该网络旨在精细地模拟蚀刻过程中涉及的三维几何变换，特别是光刻胶线条到基片的线边缘粗糙度（LER）转移。该模型使用Optuna框架进行优化，并融入了dropout和L2正则化等机制，表现出高度的泛化能力和对过拟合的鲁棒性。这体现在训练和验证损失的紧密一致以及未见数据上持续较低的误差指标上。这些能力凸显了模型在半导体制造中保持精度和可靠性所必需的复杂模式识别任务方面的熟练程度。

在沉积阶段，第二个DNN模型专注于使用二值化俯视图扫描电子显微镜（SEM）图像预测粗糙基片上沉积薄膜的厚度。该模型展示了快速学习和适应能力，这从迅速稳定的训练和验证损失曲线中得以体现。值得注意的是，该模型能够准确量化沉积厚度，与实际测量值紧密一致。这种准确性不仅证明了模型在实际场景中的有效性，还强调了其在材料科学和半导体生产中自动化和改进质量保证流程的潜力。

总体而言，将机器学习融入这些纳米技术制造过程不仅提高了预测准确性，还为这些行业内的控制机制带来了革命性的变革途径。我们的研究结果预示着机器学习在未来将在纳米技术领域进一步精炼和创新方面的广泛应用，从而推动更智能、更快速、更可靠的制造成果。

致谢

本研究得到了由英特尔（Intel）和默克（Merck）支持的“人工智能驱动的可持续半导体工艺和制造技术路径（AWASES）”项目的资金支持。

文章参考：Machine Learning Applications in Nanotechnology Manufacturing: From Etching Accuracy to Deposition Prediction | Proceedings of the 13th Hellenic Conference on Artificial Intelligence