等离激元产生于光与金属纳米结构的相互作用,其共振特性已成为纳米光子学领域的一个研究重点,基于可调谐等离子体共振的金属纳米结构光开关受到广泛关注。与此同时,如何设计高性能的纳米开关结构也成为一个重要的研究方向,深度学习方法在纳米光子结构的逆设计中展现出强大的应用潜力,可以高效利用巨大的参数空间。本文利用神经网络近似金属纳米结构的光学响应,并通过反向传播来实现纳米结构的逆设计,分析了光栅光开关的性能优势,并对未来研究方向进行了展望。 The resonance characteristics of plasmon generated by the interaction between light and metal nanostructures have become a research focus in the field of nanophotonics, and the metal nanostructured optical switches based on tunable plasmon resonance have received extensive attention. At the same time, how to design high-performance nanoswitch structures has become an important research direction, and deep learning methods show strong application potential in the inverse design of nanophoton structures, which can efficiently use huge parameter space. In this paper, neural networks are used to approximate the optical response of metal nanostructures, and inverse design of nanostructures is realized through backpropagation. The performance advantages of grating optical switches are analyzed, and the future research directions are prospected.
等离激元产生于光与金属纳米结构的相互作用,其共振特性已成为纳米光子学领域的一个研究重点,基于可调谐等离子体共振的金属纳米结构光开关受到广泛关注。与此同时,如何设计高性能的纳米开关结构也成为一个重要的研究方向,深度学习方法在纳米光子结构的逆设计中展现出强大的应用潜力,可以高效利用巨大的参数空间。本文利用神经网络近似金属纳米结构的光学响应,并通过反向传播来实现纳米结构的逆设计,分析了光栅光开关的性能优势,并对未来研究方向进行了展望。
逆设计,纳米光子学,神经网络,等离激元,光开关
Mingqian Liang1,2, Yinan Zhang1*
1Institute of Photonic Chips, University of Shanghai for Science and Technology, Shanghai
2School of Optical-Electrical and Computer Engineering, University of Shanghai for Science and Technology, Shanghai
Received: Apr. 22nd, 2024; accepted: May 24th, 2024; published: May 31st, 2024
The resonance characteristics of plasmon generated by the interaction between light and metal nanostructures have become a research focus in the field of nanophotonics, and the metal nanostructured optical switches based on tunable plasmon resonance have received extensive attention. At the same time, how to design high-performance nanoswitch structures has become an important research direction, and deep learning methods show strong application potential in the inverse design of nanophoton structures, which can efficiently use huge parameter space. In this paper, neural networks are used to approximate the optical response of metal nanostructures, and inverse design of nanostructures is realized through backpropagation. The performance advantages of grating optical switches are analyzed, and the future research directions are prospected.
Keywords:Inverse Design, Nanophotonics, Neural Network, Plasmon, Optical Switching
Copyright © 2024 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
近年来,纳米光子学通过操纵光与物质在纳米尺度上的相互作用彻底改变了光学领域。光与金属纳米结构相互作用时引起的表面等离子体共振在光学传感 [
等离激元光开关相比于传统光学开关具有高对比度、高灵敏度、低功耗、易于集成等优势。等离激元是光与贵金属表面自由电子相互作用产生的震荡模式,当光与自由电子集体震荡频率相匹配时,会激发表面等离激元共振,被束缚在亚波长以下的界面附近 [
等离激元光开关采用的是光栅结构,并涂覆一层极薄的聚苯胺。光子纳米结构的设计以往采用传统的策略,通过全电磁模拟的方法,不断调整结构的几何参数,从而得到符合期望功能的结构。这在很大程度上依赖于设计者的经验,而且随着结构复杂性的增加,计算成本变得昂贵且效率低下,这样的设计过程不是我们所希望的也是不能承受的。此外,传统的设计方法只能寻找部分参数空间的最优结构,很难给出给定参数空间中的最优解。
人工神经网络 [
图1. 神经网络正向训练模型
在这项研究中,我们要设计的是一个涂覆聚苯胺薄膜的金纳米光栅结构,光栅结构可以为入射波提供一个波矢补偿,满足共振条件,我们的目标是用神经网络来模拟这个结构,输入结构参数,输出可见光范围内的采样光谱。我们需要考虑的参数有光栅的宽度、高度、缝宽以及薄膜的厚度,这些因素共同影响着结构的共振特性。宽度范围为400~670 nm,高度范围为50~200 nm,缝宽范围为20~100 nm,薄膜的厚度范围为5~30 nm。这几乎遍历了存在最优结构的参数空间,实现了比传统方法更广泛的研究范围,采用有限时域差分法模拟了5000组不同结构参数的样本,采用400~800 nm范围的平面波光源垂直入射,水平方向设置为周期性边界条件,竖直方向设置为完美匹配层,采集的透射光谱为光栅开关状态下的两组数据,范围为400~800 nm。通过编写脚本语言来控制参数的随机设置、电磁模拟的运行、结果的保存等,这是一个自动化的过程,不需要额外消耗人力。
我们使用深度学习方法来解决模拟计算以及逆设计中的挑战,首先建立一个正向网络模型,以准确即时地预测金纳米光栅结构地透射光谱。以结构的几何参数作为输入并以光谱作为输出在金纳米光栅结构几何参数与透射光谱之间构建一个完全连接网络。在训练过程中,将数据集分割为训练集、测试集、验证集三个部分。将训练集送入网络,利用RMSProp Optimizer算法反向更新权重与偏置来优化网络的性能,其中损失函数被定义为输出光谱与实际光谱的均方误差;验证集是训练集中独立出的一部分数据,不用于模型的训练,而是用于检验网络的性能,对超参数进行优化;测试集是一组全新的数据,既不用于模型训练也不用于超参数选择,它用于最终评估模型的性能。通过电磁模拟获取的5000组数据,按8:1:1的比例分为训练集、验证集、测试集。对于一个模型来说,隐藏层和神经元的个数在一定程度上代表了它对数据的学习能力,但对于某一数据来说并不是隐藏层和神经元的个数越多其学习能力越强,需要根据实际的训练大小,选择验证损失最低的模型,含有4个隐藏层以及每层有200个神经元的网络模型表现出了较为优异的性能,其中学习率为0.009,衰减为0.99。在对数据进行一个完整训练的过程中,将数据分为若干小批次,对每个小批次进行前向传播、计算损失、反向计算梯度、更新权重偏置,完成一个迭代循环。每10次循环作一次验证,使用验证集评估模型性能。训练可以在有限次的迭代循环下迅速收敛,验证损失函数随迭代循环次数的增加而下降。经过700多次训练后,验证损失下降为3.30 × 10−4,之后没有明显下降,训练中损失函数变化如图2(a)所示,权重和偏置被固定和保存。最后,为了评估模型的性能,使用测试集来测试该神经网络预测的准确性。预测了2组在训练集之外的不同结构参数的透射光谱,并与电磁模拟的结果相比较。如图2(b)是预测和模拟的开关状态下的光谱图,预测结果与模拟结果非常接近。虽然模型只训练了5000组样本,但是该网络很好地匹配了光谱尖峰和低谷的特征,用一种近似的方法很好地解决了计算成本昂贵的光学响应问题。
图2. 神经网络正向预测与逆向优化性能
我们期望能由已知的光谱直接得到结构参数,所以建立了一个由光谱到结构参数的逆向神经网络,然而训练结构并不理想,模型的损失非常大。出现这种情况的主要原因是存在严重的非唯一性问题,即不同的结构参数可能会对应相同或相似的光谱响应,导致网络的损失在逆方向上很难收敛 [
神经网络逆设计可以用来优化在特定波长处透过的结构,如图3(a),图3(b),图3(c)所示是逆设计的在600 nm、650 nm、700 nm处具有较高调制效率的光开关结构的开态和关态透射光谱。三种结构的宽度、高度、缝宽和膜厚参数分别441 nm、196 nm、95 nm、26 nm;530 nm、196 nm、63 nm、27 nm;600 nm、185 nm、29 nm、27 nm。我们选用的金属材料是金,金在可见光范围特别是长波长区域展现出优异的等离子体共振特性,适合产生单波长高效精确的透射光谱。在逆设计开关结构过程中,我们希望最大限度地提高单波长处的透过率,同时最小化其余波长处的透过率,权重已被训练并固定。我们创建了一个期望光谱,并把它与实际输出光谱的均方误差作为损失函数,神经网络经过迭代训练不断使输出光谱接近期望光谱的几何形状。在长波长区域,网络可以逆设计出单波长高透过的结构,而随波长减小,透射峰值明显下,这是由金在短波长处不可避免的强光学损耗引起的。
图3. 神经网络逆设计的开关光谱及开关对比度
图3(d)所示为600 nm、650 nm、700 nm开关结构的光开关对比度,定义为γ = (Ion− Ioff)/Ion,其中,Ion和Ioff分别为等离激元光栅结构开态和关态下的透射强度。设计的各结构都表现出了较高的光开关对比度。
通过FDTD模拟了涂覆不同状态聚苯胺薄膜的光栅结构的开关波段处的光传输,如图4所示为FDTD模拟的650 nm波段开关的开、关态电场强度分布,图4(a),图4(c),图4(e)为涂覆还原态聚苯胺的光栅结构,图4(b),图4(d),图4(f)为涂覆氧化态聚苯胺的光栅结构。我们可以直观地看到开关状态下光与结构的相互作用强弱,相对于关态,开态情况下表面等离激元激发,增强了光与结构的相互作用,光栅结构狭缝内的光强显著增强,这意味有一个较高的光开关调制范围。
(a) 600 nm开关的开态电场 (b) 600 nm开关的关态电场
图4. 600 nm、650 nm、700 nm处开关结构的开、关态电场强度分布
为了分析各波段开关光谱在人眼中的颜色,将逆设计的600、625、650、675、700 nm五个不同波段开、关态光谱转换为对应的颜色坐标,并绘制在CIE色度图中,如图5所示。关态下的光谱坐标都趋近于色度图中心区域,即这些光谱整体透过率较低,颜色饱和度较低,接近灰色。而开态情况下,其坐标都处于红色区域,即光谱显示出的颜色主要由长波段的光组成,主要透射光为红光。开态区域点的坐标较为分散,颜色饱和度差异较大,这是因为对于单峰值光谱,颜色饱和度与线宽相关,越窄的线宽代表着更高的饱和度,其坐标位置也就越靠近色度图的边缘。
图5. 不同波长开、关态光谱在CIE色度图上的位置
随着对信息处理的需求越来越高,使得计算速度、能耗和信息密度成为硬件开发的关键考虑因素。电子器件出现了物理上的瓶颈,纳米光子结构成为了可靠的发展途径之一,这是因为光子有着较高的速度和能量效率。用于加速人工智能和深度学习的新硬件架构也迫切需要,像光开关这样的纳米光子结构可以在光子神经网络中作为神经处理单元进行矩阵乘法计算,有着更高的运行速度和能量效率,由于光子的非相互作用特性,可以高效地并行计算。在一个光子神经网络中,系统是无源的,不消耗任何能量。Shen等人 [
通过将传统的结构设计方法与神经网络逆设计相比较,来体现神经网络的便捷性和准确性。传统的设计过程大多从原有经验出发,对结构材料、参数以及周围介质进行建模,经过电磁模拟仿真得到透射光谱,如不满足目标光谱,则需要依据结构参数对透射光谱峰值强度及位置的可能影响来修改参数,如此循环上述过程,直至获得期望的透射光谱。神经网络是一种多层次的表征学习技术,通过非线性神经元的组合学习数据中深层次的特征,从而建立输入与输出之间的映射关系 [
在这项工作中,我们证明了神经网络可以取代成本昂贵的电磁模拟来设计金纳米光栅结构的开关光谱,它避免了我们探究光栅结构参数与其透射光谱内在的物理机制,并以一种极为快速的方式进行结构参数的逆向设计。我们只需要建立一个正向网络模型,即可实现数据驱动的、按需的纳米结构逆设计。这种逆设计方法可以应用于纳米光子学的许多其他领域,允许我们针对不同的方案进行设计。而且,逆设计过程中的反向优化传播具有良好的稳定性,适用于多种逆设计问题。然而,在这一领域我们仍面临着许多困难与挑战,光子纳米结构的小型化与复杂化使得设计的参数增多,可能会受限于机器学习的计算能力;对于纳米光子学逆设计领域,在网络中使用的是光谱或衍射效率等低维数据,限制了可实现的功能,而使用矢量场图等高维数据会受到计算能力和存储能力的限制。纳米光子结构可以为深度学习提供一个全新的平台,拥有更高的速度和效率,有望克服深度学习计算能力的瓶颈。
梁明乾,张轶楠. 神经网络逆设计电化学等离激元光开关Inverse Design of Electrochemical Plasmon Optical Switching Based on Neural Network[J]. 物理化学进展, 2024, 13(02): 317-325. https://doi.org/10.12677/japc.2024.132037
https://doi.org/10.1021/cr100313v
https://doi.org/10.1038/nmat2630
https://doi.org/10.1038/s41565-019-0583-y
https://doi.org/10.1126/science.abj3433
https://doi.org/10.1038/nphoton.2007.223
https://doi.org/10.1021/nl200791r
https://doi.org/10.1038/ncomms10479
https://doi.org/10.1038/ncomms5865
https://doi.org/10.1038/s41566-019-0547-7
https://doi.org/10.1021/cm00034a017
https://doi.org/10.1002/adma.201604862
https://doi.org/10.1021/acsphotonics.6b00607
https://doi.org/10.1126/sciadv.abd9450
https://doi.org/10.1126/sciadv.aax9324
https://doi.org/10.1515/nanoph-2018-0183
https://doi.org/10.1126/sciadv.aar4206
https://doi.org/10.1021/acsphotonics.7b01377
https://doi.org/10.1038/s41377-018-0060-7
https://doi.org/10.1038/nphoton.2017.93
https://doi.org/10.1038/nature14539