摘要
訓練復雜的AI模型需要大量計算資源而消耗大量能源。MIT使用垂直腔面發(fā)射激光器(VCSEL)陣列實現(xiàn)的光學神經(jīng)網(wǎng)絡,提供了高效的機器學習的硬件方法。本文概述了VCSEL以及它們?nèi)绾螌崿F(xiàn)集成的納米光子電路,這種電路經(jīng)過優(yōu)化可以進行神經(jīng)網(wǎng)絡計算。盡管制造和集成方面的挑戰(zhàn)還很多,基于VCSEL的處理器在從數(shù)據(jù)中心到邊緣設備等各種應用中,可將能效提升至100倍以上,從而突破了AI基礎設施的局限性。本文也介紹如何使用PhotoCAD的參數(shù)化單元格和陣列功能高效地設計VCSEL版圖。
簡介
近年來,深度神經(jīng)網(wǎng)絡在計算機視覺、自然語言處理和語音識別等領域取得重大突破。但是,目前最先進的神經(jīng)網(wǎng)絡模型需要大規(guī)模的計算能力,這已經(jīng)逼近了數(shù)據(jù)中心級基礎設施的極限。隨著AI模型日益復雜,對算力的巨大需求制約了其實用能力。
針對機器學習工作負載進行優(yōu)化的專用硬件,提供了使AI更加可持續(xù)的途徑。長期以來,人們提出使用光而不是電流實現(xiàn)高效AI硬件的光子神經(jīng)網(wǎng)絡,計算效率可以得到大幅提升。但是大多數(shù)光子架構在可擴展性、集成密度和芯片一體化方面存在挑戰(zhàn)。
垂直腔面發(fā)射激光器(VCSEL)的出現(xiàn),為集成高效的光學神經(jīng)網(wǎng)絡設計提供了可行的途徑。通過定制化工程, VCSEL 陣列可以實現(xiàn)針對神經(jīng)網(wǎng)絡進行優(yōu)化的低功率光矩陣乘法、激活和反向傳播。本文引述文獻闡述了VCSEL如何在從數(shù)據(jù)中心到終端設備等各種計算平臺中實現(xiàn)AI硬件的革命性進步[1]。
VCSEL提高ONN效率的優(yōu)勢
VCSEL是一種使用特殊鏡面結構的半導體激光器,可以從芯片表面垂直發(fā)射光線。這使其可以輕松地在同一晶圓上與電子器件和納米光子組件無縫集成。VCSEL可以使用標準的光刻技術制成高密度的陣列。
這些特性使VCSEL成為集成ONN的理想基礎模塊。每個低功率VCSEL提供一個獨立的光學信道,支持成千上萬個并行的光子連接。芯片內(nèi)波導和光檢測器完成了全光數(shù)據(jù)流,保持計算在光學域中進行。
VCSEL陣列與集成光子學的結合,可以實現(xiàn)對關鍵的神經(jīng)網(wǎng)絡操作如矩陣乘法的大規(guī)模加速,其性能遠超數(shù)字芯片。VCSEL等光學組件本身就具有模型神經(jīng)網(wǎng)絡激活所需的非線性。它們基于物理的優(yōu)勢完全匹配了深度學習的需求。
通過最小化高能耗的光電轉換,基于VCSEL的ONN終于釋放了光計算在AI領域的潛力。實驗已經(jīng)證明,相比數(shù)字硬件,使用VCSEL光子處理器來運行機器學習任務可以提高超過100倍的能效。
神經(jīng)網(wǎng)絡設計的創(chuàng)新
為了充分發(fā)揮VCSEL的優(yōu)勢,MIT的研究人員開創(chuàng)了針對光子約束進行優(yōu)化的ONN架構。
一個關鍵的創(chuàng)新是將每個VCSEL分配給一個神經(jīng)網(wǎng)絡神經(jīng)元。VCSEL的發(fā)光編碼了每個神經(jīng)元狀態(tài),光學信號在波導中傳播。然后光檢測器陣列同時接收來自所有VCSEL的組合光信號,在層與層之間進行大規(guī)模并行的光子矩陣乘法。
VCSEL的戰(zhàn)略分組還利用光學干涉實現(xiàn)了激活函數(shù)。使用專門的光子電路同樣可以實現(xiàn)反向傳播等訓練技術。這些創(chuàng)新總和起來構成了專門為神經(jīng)網(wǎng)絡工作負載進行效率最大化優(yōu)化的定制VCSEL-ONN處理器。
其結果是一個使用光加速整個神經(jīng)網(wǎng)絡計算流水線的集成系統(tǒng)。這證明了基于VCSEL的ONN對AI基礎設施具有變革性的潛力。
商業(yè)化展望
由于VCSEL陣列的制造性,專門用于機器學習的VCSEL-ONN芯片在資金充足的情況下,有望幾年內(nèi)實現(xiàn)商業(yè)規(guī)模,這將是AI硬件劃時代的關鍵時刻。
隨著VCSEL生產(chǎn)規(guī)模的擴大,光子神經(jīng)網(wǎng)絡處理器有望徹底改變各種環(huán)境下的機器學習:
數(shù)據(jù)中心可以在當前能耗限制下大規(guī)模擴展計算力,訓練更大的模型。
手機等邊緣設備可以本地運行強大的AI算法,而不會耗盡電池。
經(jīng)優(yōu)化的VCSEL-ONN協(xié)處理器可以加速車輛、機器人等平臺上的AI。
高效的光學AI芯片組有助于普及機器學習的應用。
要實現(xiàn)這一愿景,需要解決 VCSEL提升集成密度、降低成本以及與其他新興硬件競爭等挑戰(zhàn)。但是VCSEL-ONN革命性的為以光為動力運行AI提供了最可行的途徑。
4個步驟,利用PhotoCAD的參數(shù)化單元格和陣列實現(xiàn)高效的VCSEL版圖:
1. 定義VCSEL單元格幾何形狀和規(guī)則
2. 創(chuàng)建所需的網(wǎng)格圖案陣列
3. 如果需要可添加隨機擾動
4. 生成版圖GDS文件
結論
VCSEL有望通過為神經(jīng)網(wǎng)絡工作負載帶來超高效率的集成納米光子處理器來改變AI。通過定制化工程,VCSEL終于能夠釋放光計算在新一代智能領域的潛力。盡管這項技術仍需不斷成熟與商業(yè)化,基于VCSEL的光學神經(jīng)網(wǎng)絡指向了在各種計算平臺上實用、高效、無所不在的AI。專門構建的光子硬件將突破限制,實現(xiàn)更強大和豐富的智能系統(tǒng)。
利用PhotoCAD參數(shù)化單元格和自動化陣列生成功能, 可以大幅提升VCSEL芯片設計的效率。PhotoCAD支持構建可定制的VCSEL單元格,支持多種陣列排布,并集成DRC以及數(shù)據(jù)準備功能,使芯片設計從概念到制造端到端貫穿。
參考文獻
[1] Chen, Z., Sludds, A., Davis, R. et al. Deep learning with coherent VCSEL neural networks. Nat. Photon. 17, 723–730 (2023). https://doi.org/10.1038/s41566-023-01233-w