每日最新頭條.有趣資訊

深度學習技術其實沒那麽美好

深度學習是人工智能領域中最熱門的機器學習方法之一,其目的在於建立、模擬人腦進行分析學習的神經網絡,然後通過模仿人腦的機制來解釋數據,比如影像、聲音和文本等。至於其優勢,可以說,深度學習在大數據集上的表現比其他機器學習方法都要好,因為它更適合無標記數據,因而並不局限於以實體識別為主的自然語言處理(NLP)領域。

然而,深度學習也不是一項完美的技術——總部位於西雅圖的艾倫人工智能研究所(Allen Institute for Artificial Intelligence)和其他研究小組、初創公司以及電腦科學家正在專注於通過人工智能的方式解決一些深度學習中存在的弱點。

在過去的五年裡,人工智能領域中最熱門的一個話題就是一個被稱為“深度學習”的分支。簡單來說,該技術為電腦提供了一種通過處理大量數據來展開學習的方法。也是因為深度學習的存在,電腦可以輕鬆完成人臉識別與語音識別,讓其他形式的人類智能突顯出來。

面對深度學習的巨大機會,一些科技巨頭,如谷歌、Facebook和微軟等公司已經全身心投入到深度學習中。而一些試圖讓深度學習解決所有問題(從癌症治療到工業自動化)的初創企業,也隨時隨地在鼓吹自己在該領域的“專長”。在這種情況下,深度學習技術的感知和模式匹配(pattern-matching)能力正逐漸應用於藥物發現以及自動駕駛汽車等領域。

不過,最近也有一些科學家對深度學習產生了質疑,這項技術真的這麽厲害嗎?

過度依賴深度學習,可能會導致“美夢”幻滅

最近,不管是與AI專家的對話,還是一些關於AI的在線評論,亦或是一些長篇幅的論文,越來越多的人工智能專家都在警告稱,現在對深度學習技術的過度依賴可能會被蒙住雙眼,造成投資過剩,之後,隨之而來的便是“美夢”破滅。

舉個例子,被譽為人工智能領域“根目錄”之一的美國科學院、美國工程院、美國藝術院三院院士,加州大學伯克利分校教授邁克爾·喬丹(Michael I. Jordan)在4月發表的一份文章,旨在緩解人們對人工智能的過高期待。他指出:“事實上,這項技術並不存在真正的人類智慧。在我看來過於相信這些算法是一種錯誤地信仰。”

除此以外,邁克爾·喬丹還表示,過去的二十年裡,在工業界和學術界取得重大進展的應該是“智能增強”(IA),這通常被人們視為對“仿人AI”的一種補充。儘管報紙上不會宣揚這樣一個事實,即仿人AI的成功實際上是有限的——我們距離實現仿人AI的願望還很遙遠。不幸的是,仿人AI領域一點點的進展和風吹草動都會被媒體關注和誇大,導致過的的興奮(和恐懼),這在其他工程領域並未出現。

還有一些專家警告說,其潛在的危險在於人工智能將會遇到技術壁壘,並最終會面臨反彈——這是自20世紀50年代“人工智能”一詞出現後陷入的一種常見模式。研究人員表示,尤其是深度學習技術,因為這些擔憂正是被技術的局限性所推動的。

深度學習存在被愚弄的風險,或許它還很膚淺

深度學習算法的實現需要使用一些相關的數據(如人臉圖片)進行,隨著提供的數據越來越多,軟體的模式匹配精確度便會越來越高。雖然就現在而言,這項技術已經取得了成功,但其結果還是主要局限於那些擁有龐大的數據集的領域,與此同時,相關任務也得到了很好的定義,比如,給圖片貼標簽或者將語音翻譯為文本。

進一步講,這項技術還在更為開放的智能領域——即意義,推理和常識知識方面——展開“掙扎”。雖然深度學習軟體可以即時識別數以百萬計的單詞,但它卻不能正確理解諸如“正義”,“民主”或“干涉”等概念詞。

此外,研究人員已經通過實驗表明,深度學習技術是很容易被愚弄的。比如,MIT的一群學生,通過實驗可能3D列印的烏龜和棒球,騙過了深度學習技術,將它們分別認為了步槍和濃縮咖啡。無獨有偶,來自華盛頓大學、密歇根大學、石溪大學和加州大學伯克利分校的一組學者將列印出來的一組貼紙粘在停止標誌上,被認為了讓車標誌或者限速標誌。

在今年年初發表於科學論文網站arXiv.org上的一篇文章中,紐約大學教授加裡·馬庫斯(Gary Marcus)提出了這樣一個問題:“深度學習是否接近終點?”他在文中寫道:“就像我們常常看到的那樣,通過‘深度學習’提取的模式比最初出現的模式更膚淺。“

如果“深度學習”是有限度的,那麽現在人們就可能為之投入太多的金錢和聰明的頭腦(人才),艾倫人工智能研究所首席執行官奧倫·伊佐尼(Oren Etzioni)說:“實際上,我們是在冒著失去推進人工智能領域其他重要概念和技術途徑的風險,發展深度學習技術。”

投身解決深度學習弱點的人工智能技術

在這場深度學習是否完美的辯論中,一些研究小組、初創公司和電腦科學家對用來解決深度學習不足的人工智能方法展現出了更多的興趣。

首先,總部位於西雅圖的非營利實驗室艾倫人工智能研究所在今年2月份宣布,它將在未來三年投資1.25億美元,主要用於研究教機器學習常識知識,這項計劃被命名為“Project Alexandria”。

雖然對於這一方面的努力,每個公司都有不同的研究方向,但他們卻有一個共同的目標——獲取比深度學習技術更廣泛和更靈活的AI技術。與此同時,這些技術會建立在很少的數據基礎上,“深度學習”只是其中的一個要素而已。

華盛頓大學電腦科學家兼艾倫人工智能研究所的研究員Yejin Choi表示:“我們不是反對深學習,而是試圖將人工智能應用於更廣泛的領域。我們並沒有批判這個工具的意思。”

開發新AI工具,用於處理事實和概念

不同於“深度學習”的新工具通常是以新方式應用的舊技術。矽谷初創公司Kyndi的電腦科學家正在用Prolog開發新的工具。Prolog是一種在20世紀70年代出現的編程語言。據了解,開發的新工具是為了人工智能的推理和知識表述而設計的,將用於處理事實和概念,並嘗試完成沒有明確定義的任務。

從事AI研究的資深人員本傑明·格羅索夫(Benjamin Grosof)今年五月加入Kyndi並擔任該公司的首席科學家。格羅索夫表示,他對Kyndi關於“將AI兩個分支聯合起來的新方法”的研究印象深刻。

Kyndi的首席執行官Ryan Welsh也表示,Kyndi已經能夠通過非常少的數據來接受培訓,並最終達到可以自動生成事實、概念和推論的效果。目前,Kyndi系統可以用10到30份科學檔案(每份檔案10到50頁)來進行訓練。訓練完成後,Kyndi的軟體能識別概念,而不僅僅是文字。

在拒絕就為三家大型政府機構展開的工作時,Kyndi一直在要求其系統回答這個典型問題:技術是否已在“實驗室環境中得到證實”。Welsh表示,Kyndi項目可以準確地推斷出答案,即使該短語沒有出現在文檔中。

而且,Kyndi的閱讀和評分軟體工作速度很快。Welsh 稱,人類分析師平均需要花費兩個小時才能讀完的一一個長篇科學文獻,在一年內可能完成1000篇左右的閱讀,而 Kyndi技術在七個小時內便可達到這一閱讀數量。

可以說,Kyndi是一個不知疲倦的數字助理,可以識別出需要人類進行判斷的檔案和文章段落。“我們的目標是提高人類分析師的生產力,”Welsh說道。

Kyndi和其他一些人認為,就人工智能領域而言,現在是時候接受一些更艱巨的挑戰了。而這與深度學習的軌跡是相呼應的——在數據爆炸之前幾十年的時間裡,深度學習幾乎沒有取得什麽進展,然而現在,越來越快的電腦卻推動了其所謂的“神經網絡”的性能的飛躍。這些網絡是鬆散地類似於生物神經元的數字層。“深”則指的是很多層。

超深度學習的其他跡象也充滿希望

Vicarious是一家開發機器人的公司,該公司旨在開發可以像人類一樣迅速地從一項任務轉向另一項任務的機器人。去年秋天,它在《科學》(Science)雜誌上發表了一項有前景的研究成果。

Vicarious表示,其人工智能技術可以從相對較少的例子中學習,模仿人類的視覺智能,而使用的數據效率是深度學習模型的300倍。更重要的是,該系統還突破了驗證碼的防禦功能,即在網站上進行扭曲的字母識別測試,以阻止黑客入侵。

另外,美國五角大樓的研究機構——國防高級研究計劃局(DARPA)已經提出了一項名為“機器常識”(Machine Common Sense)的計劃,致力於推薦大學在AI領域的研究與努力。此外,他們或許還會提供一個非商業性網絡,用於分享關於模擬人類常識推理的技術來彌補深度學習的不足的想法。如果獲得批準,這一計劃會在今年秋天啟動,最有可能運行五年,總資金約為6000萬美元。

“這是一個高風險的項目,遇到的問題會比任何一家公司或研究團隊都大,”DARPA官員David Gunning表示,並希望生產出與蘋果Siri技術相當的產品。

前些日子,一篇名為《AI Winter is Well on its Way》的文章獲得了各大科技媒體的轉載,究其內容,主要表達的意思只有一個——深度學習要完了,AI寒冬要到了。實際上,反深度學習的思潮已非一日之寒,各種關於深度學習以及人工智能的泡沫在最近半年喧囂塵上。當然,這也是不無道理的。

在小智君看來,深度學習雖然存在一定的優勢,比如,具有高效率、可塑性以及普適性,單從另一方面來說,這項技術的訓練成本也高、不能自主進行知識學習,當然也不善於解決某些特定的問題。有些支持深度學習觀點的人認為,深度學習的特殊性讓其框架可以無限增長,於是,在這種情況下,智能也就會進行不停地幾何級擴張。

然而,在實踐中,這顯然是做不到的。首先是無限增長架構效果並不一定好,這在很多過分複雜的模型中都得到了印證;其次過於複雜的架構,同時也意味著巨大的能耗和龐大的數據需求量,這都是現在無法負擔的。所以反深度學習也有一定的道理。

只能說,在AI嘗試商業化的路上,勢必會存在很多反對聲音或者不穩定的影響因素。而從現在看,商業應用初級深度學習的技術紅線,也還有非常遙遠的距離去實現。

更多精彩內容,關注鈦媒體微信號(ID:taimeiti),或者下載鈦媒體App

獲得更多的PTT最新消息
按讚加入粉絲團