隨著大數(shù)據(jù)、物聯(lián)網(wǎng)以及 5G 系統(tǒng)應(yīng)用的日益廣泛,數(shù)據(jù)傳輸?shù)乃俣群腿萘啃枨蠹眲≡黾樱杌娮蛹尚酒某叨群陀?jì)算效率逐漸趨近物理極限。而光子集成芯片以光子為信息載體,具有體積小、速度快、集成度高的優(yōu)勢(shì),在光通訊、量子計(jì)算、量子信息處理等領(lǐng)域得到了快速發(fā)展。
我們可以把光子比作火車(chē),把光子器件比作火車(chē)軌道和火車(chē)站,光子在光子芯片中傳輸、處理,就像是火車(chē)在鐵軌上行走,并在火車(chē)站里實(shí)現(xiàn)人員的交換(信號(hào)的處理)。
波導(dǎo)是光子芯片器件中最基礎(chǔ)的單元之一,其主要功能是引導(dǎo)光沿著特定路徑傳輸。光子器件中的波導(dǎo)類似于我們常見(jiàn)的光纖,可以對(duì)光實(shí)現(xiàn)有效束縛。除此之外,利用波導(dǎo)還可以制備多種常見(jiàn)的光功能器件。比如,圖 1a 所示的是一種定向耦合器(Directional Coupler,DC),通常是由兩根波導(dǎo)構(gòu)成的光子器件,當(dāng)光在其中一根波導(dǎo)傳輸時(shí),在某些特定的情況下,光并非完全局域在波導(dǎo)內(nèi),有一部分會(huì)貼在波導(dǎo)外表面(電磁波的倏逝場(chǎng)效應(yīng)),如果另一根波導(dǎo)和這根波導(dǎo)靠的很近,那么這些光就可以進(jìn)入另一根波導(dǎo)(也就是耦合效應(yīng))。通常,光信號(hào)在兩根波導(dǎo)之間的傳輸具有明確的方向性,因此這種結(jié)構(gòu)被稱作定向耦合器。通過(guò)對(duì)第二根波導(dǎo)光信號(hào)進(jìn)行分析、處理等,實(shí)現(xiàn)特定的功能。圖 1b 紅色虛線區(qū)域所示的光子器件叫做馬赫曾德?tīng)柛缮鎯x(Mach-Zehnder Interferometer, MZI),也是由兩根波導(dǎo)組成,只不過(guò)這兩個(gè)波導(dǎo)里的光都是從同一端輸入的,不同的是,在這種結(jié)構(gòu)中,通過(guò)對(duì)下面的波導(dǎo)進(jìn)行一定的調(diào)制(通常是加電),利用電光效應(yīng)(改變折射率)可以改變傳輸光的相位,讓上下兩束光產(chǎn)生相位差,進(jìn)而產(chǎn)生干涉來(lái)調(diào)節(jié)輸出端口光信號(hào)的強(qiáng)度,廣泛用于相位調(diào)制、光強(qiáng)度調(diào)制和光偏振調(diào)制等領(lǐng)域。
圖1:比較常見(jiàn)的幾種光子器件 a定向耦合器[1];b馬赫曾德?tīng)柛缮鎯x[2]
超表面(metasurface)則是另一類波導(dǎo)器件,其由排列在二維平面的納米結(jié)構(gòu)單元組成,每一個(gè)結(jié)構(gòu)單元像一個(gè)個(gè)微型“光學(xué)天線”一樣,能夠在納米尺度上精確調(diào)節(jié)光的相位、振幅和偏振狀態(tài)。通過(guò)對(duì)這些結(jié)構(gòu)的巧妙設(shè)計(jì),科學(xué)家們可以讓光按照預(yù)設(shè)的方式折射、反射、聚焦,甚至改變顏色、亮度或者傳播方向,就像給光裝上了“指揮棒”。比如,2011 年美國(guó)科學(xué)家 Capasso 團(tuán)隊(duì)所提出了一種 V 形天線結(jié)構(gòu)的超表面(圖 2a),可以實(shí)現(xiàn)電磁波傳輸異常的偏折(圖2b,藍(lán)色線段表示正常反射和折射路徑,紅色線段表示異常反射和折射路徑)。
圖 2:基于 V 形天線結(jié)構(gòu)的超表面結(jié)構(gòu)[3]
在這些光子器件中,結(jié)構(gòu)的幾何參數(shù)和外部調(diào)控參數(shù),例如波導(dǎo)寬度、耦合區(qū)域長(zhǎng)度、波導(dǎo)間間距、外加電信號(hào)強(qiáng)度等都會(huì)產(chǎn)生不同的功能。在設(shè)計(jì)此類光子器件時(shí),需要根據(jù)實(shí)現(xiàn)的功能,找出特定的參數(shù)。因此,光子器件結(jié)構(gòu)設(shè)計(jì)顯得尤為重要。
像波導(dǎo)這樣的單個(gè)器件設(shè)計(jì)起來(lái)相對(duì)容易一些,通過(guò)調(diào)控某幾個(gè)參數(shù),比如波導(dǎo)的幾何尺寸、材料類型等,往往就可以實(shí)現(xiàn)想要的功能。不過(guò)當(dāng)這些光子器件集成在光芯片中時(shí),比如超表面結(jié)構(gòu)就包含了多個(gè)基本器件單元,不同基本單元之間的相對(duì)角度、距離、尺寸等都會(huì)影響它們之間的耦合、相互作用,進(jìn)一步加劇了設(shè)計(jì)難度。
為了減少加工成本,不得不借助計(jì)算機(jī)技術(shù)在加工器件之前進(jìn)行模擬仿真,可以減少實(shí)驗(yàn)成本,也有利于設(shè)計(jì)出功能較為復(fù)雜的結(jié)構(gòu)。例如,常用的數(shù)值模擬方法有時(shí)域有限差分法(Finite-Difference Time-Domain,F(xiàn)DTD)、有限元法(Finite Element Method,F(xiàn)EM)等。
盡管這類數(shù)值模擬的方法在光子器件設(shè)計(jì)中獲得了廣泛的應(yīng)用,但仍存在一定的局限性。以 FDTD 為例,在模擬時(shí)先把要將模擬的區(qū)域劃分出極小的網(wǎng)格,同時(shí)將光的傳播過(guò)程劃分成無(wú)數(shù)個(gè)極短的瞬間。然后按照光的傳播規(guī)律(麥克斯韋方程),逐個(gè)計(jì)算每個(gè)網(wǎng)格在不同時(shí)刻的光場(chǎng),最終將這些結(jié)果拼在一起,就可以得到光在器件里傳輸時(shí)的完整過(guò)程了。受限于 FDTD 數(shù)值方法的固有特性,在模擬光學(xué)器件時(shí),單次計(jì)算區(qū)域的網(wǎng)格要小于波長(zhǎng)。這種超高分辨率的要求使得傳統(tǒng)方法在模擬大尺寸光子器件時(shí)就顯得力不從心了。
此外,在設(shè)計(jì)實(shí)現(xiàn)某種特定功能的光子器件時(shí),設(shè)計(jì)者通常只能對(duì)某些特定的參數(shù)進(jìn)行調(diào)整,例如耦合區(qū)域長(zhǎng)度,波導(dǎo)寬度等。但實(shí)際影響器件性能的因素有很多,這種采用特定結(jié)構(gòu)參數(shù)調(diào)整的方法大大限制了設(shè)計(jì)的自由度。對(duì)于較為復(fù)雜的器件,往往要通過(guò)嘗試大量不同參數(shù)組合以尋找最優(yōu)解,計(jì)算成本和時(shí)間也隨參數(shù)的數(shù)量指數(shù)級(jí)增加,有時(shí)需要數(shù)天甚至數(shù)周才能完成一個(gè)滿足使用要求的光子器件。比如,想要模擬波導(dǎo)幾何尺寸對(duì)光傳輸?shù)挠绊?,就要考慮波導(dǎo)的寬度、高度、長(zhǎng)度三個(gè)參量,如果每個(gè)參量的變化是從 11 μm-20 μm,參量改變步長(zhǎng)是 1 μm,每個(gè)維度的可能性就是 10 種,三個(gè)維度就是 1000 種,相當(dāng)于計(jì)算機(jī)要計(jì)算 1000 次才可以模擬完成。因此,上述方法一般可以設(shè)計(jì)的光子器件尺寸往往只能在百微米量級(jí)。
總之,傳統(tǒng)方法不僅會(huì)消耗大量的計(jì)算資源,也會(huì)在集成度上存在限制。
近年來(lái),人工智能(Artificial Intelligence,AI)技術(shù)的迅速發(fā)展為科學(xué)研究提供了新的契機(jī)。2024 年諾貝爾物理學(xué)獎(jiǎng)、化學(xué)獎(jiǎng)均頒發(fā)給 AI 領(lǐng)域的科學(xué)家。機(jī)器學(xué)習(xí),尤其是深度學(xué)習(xí),已被廣泛應(yīng)用在微結(jié)構(gòu)的高效率設(shè)計(jì)和結(jié)構(gòu)優(yōu)化等方面,大大縮短了微結(jié)構(gòu)的設(shè)計(jì)時(shí)間,同時(shí)也為大面積結(jié)構(gòu)的設(shè)計(jì)提供了新的技術(shù)手段。
那么,AI 是如何做到的呢?
首先,AI通過(guò)收集大量的特定光學(xué)結(jié)構(gòu)的數(shù)據(jù)以及對(duì)應(yīng)的光學(xué)性能,利用這些數(shù)據(jù)對(duì)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練。這就好比我們先讓模型學(xué)習(xí)一本“字典”(稱為正向模型網(wǎng)絡(luò)),將結(jié)構(gòu)參數(shù)和光學(xué)性能對(duì)應(yīng)起來(lái)。訓(xùn)練完成后,模型就會(huì)就會(huì)變成一個(gè)經(jīng)驗(yàn)豐富的設(shè)計(jì)專家。然后,給模型輸入特定的功能要求,模型會(huì)在字典中查找類似的結(jié)構(gòu)。當(dāng)然這種結(jié)構(gòu)還不能滿足要求,還需要通過(guò)對(duì)初始設(shè)計(jì)進(jìn)行不斷優(yōu)化(稱為逆向設(shè)計(jì)模型網(wǎng)絡(luò))。
為了實(shí)現(xiàn)正向模型網(wǎng)絡(luò)對(duì)“結(jié)構(gòu)→性能”精準(zhǔn)映射和逆向設(shè)計(jì)模型網(wǎng)絡(luò)從“功能→結(jié)構(gòu)”反推優(yōu)化,科學(xué)家提出很多優(yōu)化方法。這些方法中,梯度下降算法因?yàn)楹?jiǎn)單、高效,是目前應(yīng)用最廣泛的一種。
這種方案就像我們?cè)谏巾攲ふ彝ㄍ焦鹊淖疃搪窂健.?dāng)你站在山頂上時(shí),這時(shí)還不知道最佳的路徑,只有一個(gè)粗略的方向。如果是你,你會(huì)怎么做呢?
下山時(shí),你需要通過(guò)當(dāng)前的坡度來(lái)決定下坡的方向。通常的方案是,你沿著坡度下降的方向不斷前進(jìn),每次都朝著最陡的方向走,才會(huì)快速接近山谷(圖 3)。
圖 3:下山尋找最短路徑示意圖[4]
看到這里,大家可以想一下,沿著梯度最大的方向行走,就一定會(huì)達(dá)到山谷嗎?
實(shí)際上,如果走著走著遇到了一個(gè)小洼地,無(wú)論往哪個(gè)方向再邁一步,都是梯度增加的方向,模型以為這就是山谷了,而事實(shí)并非如此。
這種遇到“假山谷”的情況就使得 AI 陷入“局部最小值”,而無(wú)法達(dá)到“全局最小值”。為了避免這一問(wèn)題,可以通過(guò)調(diào)節(jié)步伐大小、引入隨機(jī)擾動(dòng)等方法,盡快讓 AI 跳出小洼地,找到“全局最小值”, 從而到達(dá)山谷。
在設(shè)計(jì)光子器件時(shí),一般是根據(jù)已有的知識(shí)或經(jīng)驗(yàn)設(shè)計(jì)一些可能的器件結(jié)構(gòu)。此時(shí),我們并不清楚哪些結(jié)構(gòu)參數(shù)是最優(yōu)的,光傳輸效率還比較低、損耗還比較大。當(dāng)前結(jié)構(gòu)的性能(如傳輸效率、光損耗、集成度等)相對(duì)于各個(gè)設(shè)計(jì)參數(shù)(如波導(dǎo)寬度、材料折射率等)的變化率為“梯度”,相當(dāng)于下山時(shí)的“坡度”。AI 通過(guò)計(jì)算不同參數(shù)對(duì)最終性能的影響,得出“梯度”。比如,從 A 點(diǎn)出發(fā),通過(guò)尋找附近最大的“梯度”,并沿著這一方向就可以走到 B 點(diǎn),從而降低目標(biāo)函數(shù)(如損失函數(shù))的值(圖 4)。這就像你在山中根據(jù)坡度來(lái)判斷下一步的方向。重復(fù)這個(gè)步驟,逐步調(diào)整模型參數(shù),使目標(biāo)函數(shù)達(dá)到最小值,最終就能到達(dá)最低點(diǎn) C 點(diǎn)。這個(gè)過(guò)程幫助 AI 知道應(yīng)該如何調(diào)整設(shè)計(jì)參數(shù),使得光子器件的性能逐步提升。
圖 4:梯度下降算法示意圖[4]
同樣,在 AI 設(shè)計(jì)光子器件時(shí),學(xué)習(xí)率決定了每次調(diào)整設(shè)計(jì)參數(shù)的步伐。如果學(xué)習(xí)率太大,模型可能會(huì)因?yàn)檎{(diào)整過(guò)度而陷入不好的設(shè)計(jì);如果學(xué)習(xí)率太小,模型則會(huì)慢慢收斂,效率低下或者陷入“局部最小值”。
總之,AI 在一個(gè)龐大的設(shè)計(jì)空間中不斷進(jìn)行優(yōu)化。經(jīng)過(guò)不斷的調(diào)整、優(yōu)化,最終找到了最佳的參數(shù)。這時(shí),AI 就像是你成功地從山頂下到了山谷的最低點(diǎn),找到了最合適的光子器件結(jié)構(gòu),使得光子器件的性能達(dá)到了最優(yōu)。利用這種方法就可以根據(jù)我們的需求快速地設(shè)計(jì)相應(yīng)的結(jié)構(gòu),大大縮短了設(shè)計(jì)時(shí)間并提高了設(shè)計(jì)的準(zhǔn)確性,甚至可以設(shè)計(jì)出很多人類都無(wú)法想象的結(jié)構(gòu)。
我們以超表面結(jié)構(gòu)為例解釋 AI 是如何設(shè)計(jì)光子結(jié)構(gòu)的。圖 5 展示的是一種尺度小于波長(zhǎng)、具有高品質(zhì)因子的共振超表面結(jié)構(gòu)[5]。類似于圖 2 的超表面結(jié)構(gòu),這種超表面結(jié)構(gòu)也是由許多基本單元結(jié)構(gòu)(圖 5 藍(lán)色結(jié)構(gòu))排列成的二維平面結(jié)構(gòu)。每個(gè)基本單元由兩個(gè)相同的硅納米棒組成。高品質(zhì)因子意味著光可以在這些結(jié)構(gòu)中被強(qiáng)烈地“困住”而不向外輻射,使得光子可以停留更長(zhǎng)的時(shí)間,大大增強(qiáng)光與材料之間的相互作用效率。利用這種結(jié)構(gòu)的共振特性,可以用于光學(xué)傳感、非線性等領(lǐng)域。由于結(jié)構(gòu)的參數(shù)微小變化會(huì)劇烈的影響共振光譜的特性,因此要想實(shí)現(xiàn)預(yù)定的功能,傳統(tǒng)的設(shè)計(jì)方法通過(guò)連續(xù)調(diào)節(jié)結(jié)構(gòu)參數(shù)來(lái)模擬對(duì)應(yīng)的性能。不過(guò),這種方法往往只能同時(shí)優(yōu)化一兩個(gè)參數(shù),并且參數(shù)優(yōu)化的范圍和精度有限。而實(shí)際上對(duì)性能的調(diào)控需要同時(shí)對(duì)材料的屬性、幾何特性等多個(gè)變量進(jìn)行同時(shí)優(yōu)化,因此傳統(tǒng)的方法對(duì)于共振光譜的線寬、寬度等調(diào)控能力有限,并且非常耗時(shí)。
圖 5:一種硅納米棒超表面結(jié)構(gòu)示意圖[5]
為了提高了結(jié)構(gòu)設(shè)計(jì)的效率,科學(xué)家們首先利用人工神經(jīng)網(wǎng)絡(luò)模型(神經(jīng)網(wǎng)絡(luò)是人工智能的核心技術(shù)模型,概念源自于人類大腦的神經(jīng)元網(wǎng)絡(luò))將一個(gè)正向模型網(wǎng)絡(luò)(Pretrained forward model network)和一個(gè)逆向設(shè)計(jì)模型網(wǎng)絡(luò)(Inverse-design model network)串聯(lián)起來(lái)(圖 6)。然后使用開(kāi)源神經(jīng)網(wǎng)絡(luò)庫(kù)對(duì)正向模型網(wǎng)絡(luò)進(jìn)行訓(xùn)練,學(xué)習(xí)超表面結(jié)構(gòu)參數(shù)(圖 6 中右半部分的 y1,y2……)與透射光譜(圖 6 中右半部分的 x1,x2……)的映射關(guān)系(“字典”)。其次,逆向設(shè)計(jì)模型網(wǎng)絡(luò)的輸出(圖 6 中左半部分的 y1,y2……)接入已訓(xùn)練好的正向模型網(wǎng)絡(luò),通過(guò)學(xué)習(xí)這本“字典”,就可以知道如何根據(jù)目標(biāo)光學(xué)響應(yīng)(圖 6 中右半部分的 x1,x2……)找到合適的超表面結(jié)構(gòu)參數(shù)。也就是利用這本“字典”來(lái)輔助逆向設(shè)計(jì)模型網(wǎng)絡(luò)完成從光學(xué)響應(yīng)到結(jié)構(gòu)參數(shù)的預(yù)測(cè)。最后,逆向設(shè)計(jì)模型網(wǎng)絡(luò)根據(jù)光學(xué)目標(biāo)預(yù)測(cè)結(jié)構(gòu)參數(shù),并通過(guò)比較正向網(wǎng)絡(luò)的輸出與目標(biāo)響應(yīng)的誤差來(lái)更新自身參數(shù)使輸入結(jié)果與預(yù)測(cè)結(jié)果的差異達(dá)到最?。刺荻认陆邓惴ǎ瑥亩A(yù)測(cè)出符合條件的超表面結(jié)構(gòu)參數(shù),實(shí)現(xiàn)高效、準(zhǔn)確的超表面設(shè)計(jì)。
圖 6:由一個(gè)逆向設(shè)計(jì)模型網(wǎng)絡(luò)和一個(gè)預(yù)訓(xùn)練的正向模型網(wǎng)絡(luò)連接而成的TN模型架構(gòu)[5],其中,X表示輸入和輸出,即透射光譜數(shù)據(jù),而Y表示中間層的輸出,對(duì)應(yīng)的是結(jié)構(gòu)參數(shù)。
通過(guò)輸入超表面結(jié)構(gòu)的透射光譜參數(shù):工作波段λ=1500 nm,線寬(共振峰的半高寬)△λ=5 nm,形狀因子(用于描述光譜的不對(duì)稱性)q=0.5(對(duì)應(yīng)的光譜如圖 7 黑色虛線所示),最終,在固定基本單元周期 D=900 nm,納米棒厚度 150 nm 的情況下,神經(jīng)網(wǎng)絡(luò)模型設(shè)計(jì)的納米棒長(zhǎng)寬度 w=316 nm,長(zhǎng)度 L=580 nm,每個(gè)基本單元中兩個(gè)納米棒的間距 2x0=378 nm,該結(jié)構(gòu)對(duì)應(yīng)的透射光譜如圖 7 紅色實(shí)線所示??梢钥闯觯P皖A(yù)測(cè)結(jié)構(gòu)的光譜和輸入光譜(目標(biāo)結(jié)果)非常接近。
圖 7:輸入透射光譜(黑色虛線)和神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)構(gòu)的透射光譜(紅色實(shí)線)比較[5]
如果利用傳統(tǒng)的數(shù)值模擬方法,需要專業(yè)的計(jì)算機(jī),并且至少花費(fèi)秒量級(jí)的時(shí)間?;谶@種方法,利用普通的計(jì)算機(jī)(Intel(R) Core(TM) i7-4770 CPU @ 3.40 GHz, RAM: 16.0 GB)在 0.05s 的時(shí)間就完成了光學(xué)超表面結(jié)構(gòu)設(shè)計(jì),設(shè)計(jì)效率得到了顯著提升。
人工智能除了科研輔助研究人員用于光子結(jié)構(gòu)設(shè)計(jì),研究人員發(fā)現(xiàn)利用光子芯片還可以用于實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的光子結(jié)構(gòu)。相較于傳統(tǒng)的電子芯片,光子神經(jīng)網(wǎng)絡(luò)在計(jì)算速度與功耗上具有明顯優(yōu)勢(shì)。比如,2022 年 Firooz 等人實(shí)現(xiàn)了一個(gè)利用片上光子深度神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)對(duì)手寫(xiě)字母識(shí)別的系統(tǒng)(圖 8)。研究團(tuán)隊(duì)將手寫(xiě)字母圖像每個(gè)像素點(diǎn)的光強(qiáng)信息通過(guò)光柵耦合器輸入到系統(tǒng)中。通過(guò)對(duì)輸入信號(hào)進(jìn)行加權(quán)處理(Optical attenuator部分,光學(xué)衰減器),然后光進(jìn)入光電探測(cè)器(PD 部分)完成加法運(yùn)算,接著由微環(huán)諧振器(Optical modulator 部分)實(shí)現(xiàn)非線性變換(復(fù)雜特征提?。?,最終將光信號(hào)傳遞到下一層神經(jīng)網(wǎng)絡(luò)(Neuron optical output)。
圖 8:利用光子芯片識(shí)別手寫(xiě)字母[6]
這些成果展示了人工智能在光子器件中的巨大應(yīng)用潛力,為開(kāi)發(fā)新一代高效、功能豐富的光子器件打下了基礎(chǔ)。我們相信,隨著人工智能技術(shù)的迅速發(fā)展,微納光子器件設(shè)計(jì)與應(yīng)用領(lǐng)域?qū)⒂瓉?lái)一場(chǎng)巨大的技術(shù)變革。在不久的將來(lái),現(xiàn)在所用的電子設(shè)備也許都會(huì)變成光子的世界。
我們可以大膽暢想一下,未來(lái)世界會(huì)是什么樣的呢?
或許那時(shí),憑借光子在高速信息傳輸和處理方面的優(yōu)勢(shì),光量子計(jì)算機(jī)會(huì)像今天的智能手機(jī)一樣走進(jìn)千家萬(wàn)戶。
參考文獻(xiàn)
[1] WANG Q, HE Y, WANG H, et al. On-chip mode division (de)multiplexer for multi-band operation [J]. Opt. Express, 2022, 30(13): 22779-22787.
[2] DONG B, AGGARWAL S, ZHOU W, et al. Higher-dimensional processing using a photonic tensor core with continuous-time data [J]. Nat. Photon., 2023, 17(12): 1080-1088.
[3] YU N, GENEVET P, KATS M A, et al. Light Propagation with Phase Discontinuities: Generalized Laws of Reflection and Refraction [J]. Science, 2011, 334(6054): 333-337.
[4] 王東,馬少平. 圖解人工智能 [M]. 北京: 清華大學(xué)出版社, 2023.
[5] XU L, RAHMANI M, MA Y, et al. Enhanced light–matter interactions in dielectric nanostructures via machine-learning approach [J]. Advanced Photonics, 2020, 2(02): 026003.
[6] ASHTIANI F, GEERS A J, AFLATOUNI F. An on-chip photonic deep neural network for image classification [J]. Nature, 2022, 606(7914): 501-506.
轉(zhuǎn)載請(qǐng)注明出處。