Science重磅！用光速實現深度學習，跟GPU說再見

編者按：本文自來“新智元（AI_era ）”；36氪經授權轉載。

如果說GPU養大了深度學習，那麽如今深度學習的胃口早已經超越了GPU。

當然，GPU在不斷發展，也出現了TPU、IPU、MLU來滿足這頭巨獸。

深度學習對算力的需求沒有止境，但受製於能耗和物理極限，基於矽基的電子元件雖然現在還能支撐，但遠處那堵幾乎不可逾越的高牆已然顯現。

怎麽辦？

光速深度學習！

今天，Science發表了加州大學洛杉磯分校（UCLA）研究人員的最新研究：All-optical machine learning using diffractive deep neural networks，他們使用 3D 列印打造了一套 “全光學” 人工神經網絡，可以分析大量數據並以光速識別目標。

論文地址：http://science.sciencemag.org/content/361/6406/1004

這項技術名為衍射深度神經網絡（ diffractive deep neural network，D?NN），它使用來自物體的光散射來識別目標。該技術基於深度學習的被動衍射層設計。

研究團隊先用電腦進行模擬，然後用 3D 印表機打造出 8 平方厘米的聚合物層。每個晶圓表面都是不平整的，目的是為了衍射來自目標的光線。

衍射深度神經網絡由一系列聚合物層組成，每層大約 8 平方厘米。利用網絡區域內的光的衍射傳播路徑來識別目標。

研究人員使用 THz 級頻率的光穿透 3D 列印的網絡層。每一層網絡由數萬個像素組成，光可以通過這些像素傳播。

研究人員為每類的目標分配像素，來自目標的光被衍射到已分配給該目標類型的像素上。這樣，衍射深度神經網絡就能夠識別目標，其耗時與電腦 “看到” 目標所花費的時間相仿。

D?NN: 光速實時學習，成本不到 50 美元

而隨著來自不同目標的光通過 D?NN, 研究人員利用深度學習訓練神經網絡，以學習每個目標產生的衍射光圖案。

“我們使用逐層製造的無源元件，並通過光的衍射將這些層相互連接起來，打造一個獨特的全光平台，可以以光速執行機器學習任務。” 該研究團隊負責人，加州大學洛杉磯分校教授 Aydogan Ozcan 表示。

“這就像一個由玻璃和鏡子構成的複雜迷宮。光進入衍射網絡，並在迷宮周圍反射，直到其離開該區域為止。系統能夠根據某目標產生的大部分光最終離開迷宮的路徑，確定究竟是哪個目標。”Ozcan 說。

在實驗中，研究人員將影像放在 THz 級頻率的光源前。 D?NN 通過光學衍射對影像進行觀察。研究人員發現，該設備可以準確識別手寫的數字和衣服，這兩類對象都是人工智能研究中的常用目標。

圖為 D?NN 設備識別文本

在訓練中，研究人員還該將設備作為成像的鏡頭，就像一般的相機鏡頭一樣。

由於 D?NN 的組成可以由 3D 列印製造，成本低廉，可以構建規模更大、數量更多的層，製造出包含數億個人工神經元（像素）的設備。規模較大的設備可以同時識別更多的目標，執行更複雜的數據分析。

D?NN 的組件成本低廉。研究人員表示，他們使用的 D?NN 設備成本不到 50 美元。

雖然這項研究使用的是 Thz 級光譜中的光，但 Ozcan 表示，也可以打造使用可見光、紅外線或其他頻率光譜的神經網絡。他表示，除 3D 列印外，D?NN 也可以使用光刻或其他印刷技術打造。

全光學衍射深度神經網絡（D?NN）的 3D 列印衍射板

D?NN的設計和性能：MNIST分類準確率達到91.75%

在論文中，研究人員介紹了D?NN框架的技術細節、實驗和測試性能。

在D?NN全光學深度學習框架中，神經網絡物理上由多層衍射表面（diffractive surfaces）形成，這些衍射表面協同工作以光學地執行網絡可以統計學習的任意功能。雖然這個物理網絡的推理和預測機制都是光學的，但其學習部分是通過電腦完成的。

研究者將這個框架稱為衍射深度神經網絡（ diffractive deep neural network，D?NN），並通過模擬和實驗證明了其推理能力。D?NN可以通過使用幾個透射和/或反射層進行物理創建，其中給定層上的每個點都傳輸或反射進來的光波，每個點代表一個人工神經元，通過光學衍射連接到後續的層。如圖1A所示。

圖1：衍射深度神經網絡D?NN

D?NN 中的人工神經元通過由通過振幅和相位調製的次級波連接到下一層的其他神經元。圖1D是標準深度神經網絡的一個類比，可以將每個點或神經元的傳輸或反射系數視為一個“bias”項，這是一個可學習的網絡參數，在訓練過程中使用誤差反向傳播方法進行迭代調整。

經過這一數值訓練階段， D?NN的設計就固定了，並且確定了各層神經元的傳輸或反射系數。這種 D?NN設計可以以光速執行所訓練的特定任務，僅使用光學衍射和無源光學器件（passive optical components）或無需功率的層，從而創建一種高效、快速的方式來實現機器學習任務。

一般來說，每個神經元的相位和振幅可以是可學習的參數，在每一層提供複值調製（complex-valued modulation），這改善了衍射網絡的推理性能。對於phase-only調製的同調傳輸網絡，每層可以近似為一個薄的光學元件（圖1）。通過深度學習，在輸入層饋送訓練數據並通過光學衍射計算網絡輸出，每一層的神經元的phase value迭代調整（訓練）來執行一個特定的函數。

在計算目標輸出誤差的基礎上，通過誤差反向傳播算法優化網絡結構及其神經元相位值。誤差反向傳播算法基於傳統深度學習中的隨機梯度下降法。

D?NN性能：MNIST手寫數字數據集

為了演示 D?NN框架的性能，我們首先將其訓練成一個數字分類器，對從0到9的手寫數字進行自動分類(圖1B)。

為了完成這項任務，我們設計了一個五層的D?NN，其中包含來自MNIST手寫數字數據集的5.5萬張影像(5000張驗證影像)。我們將輸入數字編碼到D?NN輸入域的幅值中，訓練衍射網絡將輸入數字映射到10個檢測器區域，每個檢測器區域對應一個數字。分類標準是尋找具有最大光信號的檢測器，相當於網絡訓練過程中的損失函數。

在訓練之後，使用來自MNIST測試數據集的10000個影像（未用作訓練或驗證影像集）對D?NN數字分類器進行數值測試，並且實現了91.75％的分類精度（圖3C）。

根據這些數值結果，我們將這個5層的D?NN 設計3D列印出來（下圖），每一層的面積為8cm×8cm，然後在衍射網絡的輸出平面定義10個檢測器區域（圖1B）。

圖2：3D列印的D?NN的實驗測試

然後，我們使用0.4 THz的連續波光照來測試網絡的推理性能（圖2，C和D）。

每一層神經元的相位值用3D列印神經元的相對厚度進行物理編碼。對這個5層的D?NN設計的數值測試顯示，在 ~10000幅測試影像中，分類準確率達到91.75%（圖3C）。

圖3： D?NN手寫數字識別器的性能

D?NN性能：Fashion-MNIST數據集

接下來，為了測試D?NN框架的分類性能，研究者使用了一個更複雜的影像數據集——Fashion-MNIST數據集，其中包含10個類別的時尚產品。

D?NN對Fashion-MNIST數據集的分類結果如下圖所示。具有N = 5個衍射層的phase-only和complex valued的D?NN的分類精度分別達到81.13%和86.33％。

通過將衍射層的數量增加到N = 10，並將神經元的總數增加到40萬，D?NN的分類精度提高到86.60％。對比而言，在已有研究中，基於卷積神經網絡的標準深度學習，使用~890萬可學習參數和~250萬個神經元，Fashion-MNIST分類準確度的最高性能為96.7％。

光學神經網絡的應用

光學電路深度學習是一項重大突破，而且其現實應用已經逐漸

根據光學領域權威期刊Optica的報導，美國斯坦福大學的研究人員已經證明，可以直接在光學芯片上訓練人工神經網絡。這一重大突破表明，光學電路可以實現基於電子的人工神經網絡的關鍵功能，從而可以以更便宜、更快速和更節能的方式執行語音識別、影像識別等複雜任務。

不僅如此，斯坦福的另一組研究人員還研究出一套小型AI成像系統，採用雙層光學-電子混合計算技術，成像精度和速度均達到電子計算處理器水準。具體說，研究人員在電子計算之前加上一層光學計算，這種AI成像系統在低光照條件下具備更強的成像能力，每個立體像素上的光電子密度最高可達幾十個，同時節約了大量本該用於計算的時間和成本。

具體到這項研究，UCLA的研究團隊表示，他們的 D?NN 設備可用於全光學影像分析、特徵檢測和對象分類任務，還可以實現使用 D?NN 執行任務的新相機設計和光學組件。

例如，使用該技術的無人駕駛汽車可以立即對停車標誌作出反應，一旦收到從標誌衍射來的光，D?NN 就可以讀取標誌資訊。該技術還可用於對大量目標的分類任務，比如在數百萬細胞樣本中尋找疾病的跡象。

“這項研究為基於人工智能的被動設備提供了新機會，可以對數據和影像進行實時分析，並對目標進行分類。”Ozcan 說。“這種光學人工神經網絡設備直觀地模擬了大腦處理資訊的方式，具備很高的可擴展性，可以應用到新的相機設計和獨特的光學組件設計中，也可用於醫療技術、機器人、安全等領域。”

論文：

http://science.sciencemag.org/content/361/6406/1004

參考鏈接：

https://www.photonics.com/Articles/All-Optical_Diffractive_Deep_Neural_Network_Is/a63751

https://newatlas.com/diffractive-deep-neural-network-uses-light-to-learn/55718/