光神經網絡，正在照亮智能計算的未來

如果問一個問題——能夠進行深度神經網絡計算的芯片有哪些？大家給出的答案可能五花八門：CPU、GPU、DSP、NPU……

過去幾年裡，電子計算已經成為實現人工智能算法——尤其是深度神經網絡模型——最重要的算力支撐。儘管具體的硬體架構各有不同，但一言以蔽之，都是採用了馮諾依曼型的計算原理，即VLSI（超大規模集成電路）的“電子+邏輯”信息處理模式，以複雜的邏輯電路和處理器芯片來完成計算任務。

但是電子方法有其先天缺陷：一是信號之間容易相互干擾，對需要高密度連接的神經網絡帶來一定的困難；二是能源需求太高，導致計算成本居高不下。

在以AI為主旋律的“數字基建”大規模爆發前夜，在算力上未雨綢繆，自然也就成了學術界和產業界共同關注的頭等大事。

最近，明斯特大學、牛津大學和埃克塞特大學的研究人員就共同實現了一項新的計算芯片，採用光學系統來幫助神經網絡進行“學習”，以此實現計算、識別等行為。

不過，無論是光學計算，還是類腦芯片，類似的提法其實在學界早已有之，並且由於自身的局限性一直進展緩慢。那麽，光學深度學習芯片的出現，是否真的突破了先天的技術桎梏，又意味著哪些新的產業機遇呢？

光學計算+深度神經網絡的“攪和”歷史

在介紹新計算硬體之前，先言簡意賅地解答一下大家心中可能存在的困惑——光到底是如何進行計算的？又為什麽比電子方法更有優勢呢？

我們知道，深度學習神經網絡是模仿人類大腦神經元的運行方式而來的。在每一層中，來自上一層（或者輸入源）的信號經由神經元處理，將結果和前向信號傳遞給下一層的神經元。

很顯然，這種計算方式需要依賴神經元之間的大量、動態的連接才能完成，會對大多數使用電子方法的集成電路造成壓力。

因此，大家紛紛開始研究其他硬體，光學芯片因此成為“全村的希望”。

2017年，MIT的研究人員就研發出了一種使用光子技術實現神經網絡的方法。他們使用一系列相互連接的波導管（傳輸微波波段的電磁波裝置），來為特定的計算編程。而處理器則通過一系列耦合光子波導來引導光線，因此只需要運用鏡片改變光線的方向，就可以達成運算。

可編程、低能耗，聽起來是不是棒棒噠？不過這種方式打造的硬體準確率實在是不太令人滿意，只有77%，被傳統方法吊打的節奏啊。

不過科學家們並沒有認輸，2018年加州大學洛杉磯分校的科學家們又將光學深度學習送上了《Science》雜誌。

這次，科學家們採用3D 列印的方式製造出了一種全光學的深度學習框架D2NN。

簡單來說，研究人員訓練出了能夠識別不同數據類型的光學網絡模型，並為它們分別創建了模型，該模型由多個像素層組成，每個像素之間如同神經元一樣進行連接，並通過光來傳輸信息。

然後，研究人員採用五層 3D 列印塑料對仿真模型進行物理再現，固態成品的探測器就可以通過物體表面反射的光來判斷出相應的分類結果。

這種由光學元件堆疊而成的神經網絡硬體，準確率能達到 91.75%，成本相對便宜，但是卻很難做到器件的小型化，難以處理複雜的數據及圖像分析，而且所有參數3D列印之後就不能被再次編程了。

（使用 3D 列印的“人工神經網絡”芯片）

總結一下就是，此前的研究都對光學計算+神經網絡的解決方案提出了自己的方法，但帶來的問題多於答案，科學家們不得不繼續探索。

全光學神經突觸系統：能否刷新光學計算的進程？

5月8日，來自德國明斯特大學的科學家將其研究成果發布在了《Nature》雜誌上。

論文《All-optical spiking neurosynaptic networks with self-learning capabilities》（具有自學習功能的全光學尖峰神經突觸網絡），提出了一種可以在毫米級光子芯片上實現的全光學神經網絡。

研究人員是這麽設想的：

輸入的數據（即光波導）可以被微米級環狀諧振器調製成不同的波長，然後注入網絡並停留在光學微芯片上。接著利用集成在一起的相變材料，來實現權重調製，這種物質可以由光觸發顯著的變化，非常適合模擬突觸和神經元之間的“衝動”。

信息在光學神經網絡中的傳輸，就好像是兩組人（單個波導的兩條路徑）同時在玩傳聲遊戲，需要隔的距離比較遠，來防止另一個組的聲音干擾（耦合）。同時還不能有人亂開腦洞急轉彎，免得傳話內容南轅北轍（光離開波導）。

因此，在每個組的傳話過程中，都派出一個小秘書（相變材料），根據每組任務（權重）的不同，在每次傳遞過程中（微環諧振器的入口和出口處），對隊員們向下傳遞的信息進行微調，將被傳錯/修改的信息複位，這樣就能最大限度地保證每個隊伍向後傳遞的信息，既能保持差異，又足夠準確。

為了證明這一點，研究人員開發了一個由四個人工神經元和60個突觸組成的芯片。

芯片的結構由不同的層組成，分別在光納米電路中的不同通道上傳輸光。

（分子光學神經元電路）

研究人員使用了兩種不同的機器學習算法，分別是小規模的監督學習和無監督學習，以光脈衝的形式向後“提供”信息，以此測試全光學神經突觸系統能否根據給定的光識別出具體的模式。

目前，研究人員已經利用該技術成功實現了光學模式識別，並展現了光子神經網絡的可擴展性。

在此，我們可以簡單總結一下這種新光學神經網絡硬體的特殊之處：

首先，它解決了前輩們沒能解決的問題——光學計算在識別準確率、可編程性、微型化上的缺陷——讓光學計算在計算機硬體領域的潛力帶來了新的前景。

（正在開發的光學微芯片大約只有一分錢大小）

另外，該硬體的計算方式和大腦中神經元突觸的信息傳遞高度相似，不僅使得信息（數據）得以在人工神經網絡中傳輸，還能夠進行有效的處理和存儲。以更類似於大腦的方式處理信息，這有助於開發更高性能的算法，進而幫助智能機器更好地完成現實世界的任務。

而且，該系統只在光下工作，使它充分發揮了光學計算的優勢，處理數據的速度要快很多倍，更適合用於一些大規模數據的神經網絡，比如醫學診斷模型等。並且更加節省能耗。

這也就不難理解，為什麽有人認為，如果高能效的可擴展光子神經芯片最終出現，這一團隊的研究絕對算是開山之作了吧。

當然，想要讓可擴展光子神經網絡系統在現實中應用，還需要做許多後續工作。

最首要的，就是增加人工神經元和突觸的數量，以及神經網絡的深度，以便進一步接近和適應真實的大規模計算應用場景。

另外，芯片的製造也存在一定的限制。對此，埃克塞特大學的戴維·賴特教授表示，將使用矽技術來生產光學納米芯片。

另一個值得關注的問題是，系統中極為關鍵的相變材料，其結晶速度會吸收並減慢光速，從而限制神經元被激發的最大速率，對於光的交叉耦合帶來一定的複雜影響。因此，每一次注入該系統的總光學功率都需要進行仔細校準，以保證材料對輸入信號的響應完全符合預期。

不管怎麽說，儘管光學計算硬體仍然在實現層面面臨著許多挑戰和困難，規模化應用也沒有明確的時間表。但或多或少讓我們看到了更多有趣可行的計算方式，未來世界的算力資源依舊是充沛和值得期待的。

隨著智能基建的一步步添磚加瓦，光學計算必將變得越來越重要。