每日最新頭條.有趣資訊

下一代計算架構革命:從“全光學神經網絡”開始

新智元報導

來源:Nature

編輯:大明

【新智元導讀】近日,Nature刊載IBM新研究,使用光學器件打造的“全光學”深度神經網絡可以比傳統計算方式的能效更高,同時具備可擴展性、無需光電轉換和高帶寬等優勢。這一發現可能給未來光學神經網絡加速器的出現打下基礎。

光纖能夠以光的形式在世界範圍內傳輸數據,成為現代電信技術的支柱。不過如果需要分析這些傳輸數據,要將其從光信號轉換為電子信號,然後用電子設備進行處理。曾經有一段時間,光學被認為是未來最具潛力的計算技術的基礎,但與電子計算機的快速進步相比,光學計算技術的競爭力明顯不足。

不過,在過去幾年中,業界越來越關注對計算能源的成本問題。因此,光學計算系統再次受到關注。光學計算的能耗低,又能作為AI算法(如深度神經網絡(DNN))的專用加速硬體。 近日,Feldmann等人在《自然》期刊上發表了這種“全光學網絡實現”的最新進展。

論文地址:

深度神經網絡包括多層人工神經元和人工突觸。這些連接的強度稱為網絡權重,可以是陽性,表示神經元的興奮,或陰性,表示神經元的抑製。網絡會盡力將實際輸出和期望輸出之間的差異實現最小化,從而改變突觸的權重,來執行圖像識別等任務。

CPU和其他硬體加速器通常用於DNN的計算。DNN的訓練可以使用已知數據集,而經過訓練後的DNN可以用來推理任務中的未知數據。雖然計算量很大,但計算操作的多樣性不會很高,因為“乘法累加”操作在許多突觸權重和神經元激勵中佔主導地位。

DNN在計算精度較低時仍能正常工作。因此,DNN網絡代表了非傳統計算技術的潛在機會。研究人員正在努力打造基於新型非易失性記憶體件的DNN加速器。這類設備在切斷電源時也能保存信息,通過模擬電子計算提升DNN的速度和能效。

那麽,為什麽不考慮使用光學器件呢?導光部件中可以包含大量數據 - 無論是用於電信的光纖還是用於光子芯片上的波導。在這種波導內部,可以使用“波分複用”技術,讓許多不同波長的光一起傳播。然後可以以與電子到光學調製和光電子檢測相關的可用帶寬限制的速率調製(以可以攜帶信息的方式改變)每個波長。

使用諧振器可以實現單個波長的添加或移除,就像對貨車的裝貨和卸貨一樣。使用微米級環形諧振器可以構建DNN網絡突觸權重陣列。這種諧振器可以採用熱調製,電光調製,或通過相變材料調製。這些材料可以在非晶相和結晶相之間切換,不同的材料的吸光能力差別很大。在理想條件下,進行乘法累加運算的功耗很低。

Feldmann研究團隊在毫米級光子芯片上實現了“全光學神經網絡”,其中網絡內沒有使用光電轉換。輸入的數據被電子調製到不同的波長上注入網絡,但此後所有數據都保留在芯片上。利用集成相變材料實現突觸權重的調節和神經元的集成。

本文作者小規模地展示了有監督和無監督的學習 - 即使用標記數據實現訓練(DNN學習的方式),以及使用未標記的數據訓練(類似人類的學習方式)。

因為權重表達是通過光的吸收實現的,所以負權重需要更大的偏置信號,該信號不能激活相變材料。一種替代方法是使用Mach-Zehnder干涉儀的裝置,將單個波導分成兩個臂,然後重新組合,這時的透射光量取決於兩個傳播路徑之間光學相位的差異。然而,要想將這種方法與波分複用相結合可能難度較大,因為每個干涉儀的臂需要為每個波長引入適當的相位差。

全光學實現的DNN仍然存在重大挑戰。在理想情況下,它們的總功率使用率可能較低,經常需要熱光功率來調節和維持每個Mach-Zehnder干涉儀臂中的光學相位差異。

此外,對注入含有相變材料的系統的總光功率必須仔細校準,以使材料對輸入信號的響應符合預期。儘管相變材料也可以用於調整Mach-Zehnder相位,但是材料吸收光的強度和減慢光速之間會出現不可避免的交叉耦合,這會增加系統的複雜性。

傳統的DNN規模已經發展到很大,可能包含數千個神經元和數百萬個突觸。但是光子網絡的波導需要彼此間隔很遠才能防止耦合,並且避免急劇彎曲以防止光離開波導。因為兩個波導的交叉可能會將不需要的功率注入錯誤路徑,這對光子芯片設計的2D特性造成了實質性的限制。

實現光學器件打造神經網絡需要很長的距離和很大的面積,但是每個光學結構的關鍵部分的製造需要高精度。這是因為波導和耦合區域,比如在每個微環諧振器的入口和出口處,必須達到相應網絡性能所需的精確尺寸。對於如何製造小型微環諧振器也存在諸多限制。

最後,調製技術提供的光學效應較弱,需要很長的相互作用區域,以使其對通過的光的有限影響能夠達到顯著水準。

Feldmann 團隊的研究中所取得的進步,有望推動該領域的未來發展,該研究可能會為未來高能效、可擴展的光學神經網絡加速器的出現打下基礎。

參考鏈接:

論文地址:

獲得更多的PTT最新消息
按讚加入粉絲團