每日最新頭條.有趣資訊

一隻蝴蝶揮了揮翅膀,於是有了AI讀心術

“我的身體沉重如潛水鍾,內心卻渴望像蝴蝶般自由飛翔。”

這句來自電影《潛水鍾與蝴蝶》的台詞,也是前《ELLE》雜誌主編、記者讓·多米尼克的真實經歷。

讓·多米尼克中風癱瘓後,身體的語言和運動功能都喪失了,他不能說話,不能自主呼吸,只剩下一隻眼睛和意識可以自由活動。在這種情況下,他還是“寫”出了一部散文集。

書是這樣完成的:助手把一個個字母依次念給讓·多米尼克,直到他眨一下眼,就把那個字母記下來……如此循環進行,直到字母形成單詞、句子、片段,最終付梓成冊。

顯然,這個還原思維的過程十分艱辛且原始,但至少給他的靈魂留下了一絲自由遨遊的可能。

而對於更多缺乏發聲能力的普通人(比如中風患者、植物人等)來說,無法與正常人交流的他們,生命已然停滯。

技術能幫助他們“言其所不能言”,提高生活品質嗎?

答案是肯定的。科學家們正試圖讓看不見摸不著的思維活動自動“顯形”。

通過電腦,將大腦中的所思所想轉換成語音說出來,這種“讀心術”距離現實究竟還有多遠?

《潛水鍾與蝴蝶》(2007)劇照

AI讀心術:電腦是如何還原腦電波的?

先來潑一盆冷水,那就是想要將人想象中的單詞和句子轉換成語音,目前的電腦還做不到如此鬼斧神工的地步。

不過,已經有研究人員成功利用AI複原了人聽到或超小聲說話時的句子。

技術的實現原理也並不複雜。人類的發聲運動是靠大腦神經元電信號刺激下頜、嘴唇、聲帶等部位形成的。

因此,只要將相關腦區的神經運動信號輸送給AI系統,深度學習網絡就會根據信號與相對應的語言文字或嘴部運動進行層層匹配,推斷出具體說了什麽,再由語音合成器將這些信號轉換成能被聽到的語音。

那麽,這項技術的靠譜程度如何呢?

哥倫比亞大學電腦科學家Nima Mesgarani做了一項實驗,讓聽眾“收聽”一組與故事和數字有關的聽覺皮層數據,有75%的人能夠正確識別出該數字。

類似的實驗在加州大學舊金山分校的研究組也成功了。癲癇患者大聲朗讀句子時的大腦活動被記錄下來,借助深度學習網絡重建為書面語句。結果顯示,AI重現的句子有80%都是正確的。

既然神經信號轉譯為書面語言被證明是可行的,下一步就是要走出實驗室,真正幫助失聲人群“說出心裡話”了。

麻省理工學院的研發人員就開發了一種植入型智能增強設備,由可穿戴裝置和相關計算系統構成。

設備中的電極可以截取由內部語言所觸發的下頜和面部肌肉運動信號,被反饋到機器學習系統,再由該系統將神經信號與特定的文字相關聯。

使用者還可以通過骨傳導耳機,在不中端對話的前提下通過面部振動,將外部資訊傳遞到內耳。

目前,根據聽眾自身定製的這種可穿戴設備,平均轉錄識別準確率已經達到92%以上!

如果說前面還屬於輔助醫療範疇,到這裡就有點開掛的苗頭了。比如在國際象棋比賽中,選手要是戴上這樣一副耳機,不就可以不被察覺地“聽”到電腦給支招嗎?

麻省理工學院媒體實驗室Fluid Interfaces小組的研究員Arnav Kapur演示了AlterEgo項目

會“讀心”的腦機:腦腦交流能成為現實嗎?

利用AI讀懂腦電波,這個技術不僅僅看起來很酷,更重要的是應用空間非常巨大。

從理論層面上來說,可以不依賴於生物發聲器官來實現交流的目的,這就給醫療、工業、刑偵等領域的帶來了新的互動可能性。比如:

1.為失聲患者提供聲音。人類一旦不幸遇到中風、腦外傷、脊髓損傷或ASL運動神經細胞病(史蒂芬霍金就是ASL患者),大腦無法直接刺激言語產生,患者只能在沉默中走向死亡。如果未來大腦語音合成器被應用,幫助失聲患者找回語言功能,對於他們的治療和生活將起到極大幫助。

2.特殊環境的工作協助。並不是所有工作環境都能保障正常分貝下的語言交流,比如飛機場內的噴射噪音、航空母艦的駕駛艙、發電廠或印刷廠車間,以及穿著防護裝備的實驗室等等,不是過分嘈雜就是過分沉默,很容易錯過關鍵資訊。這種特殊環境中,大腦語音轉錄技術就能夠有效解決交流不暢的問題,聾啞殘疾員工也可以與他人無障礙交流。

3.從重建聽覺到重建視覺。除了轉錄文本和語音,類似的AI神經網絡還可以被訓練來恢復模糊的影像,比如還原記憶中的面孔,應用在刑偵破案有奇效。

4.用思維操作假肢。佩戴上語音轉錄設備之後,截肢/截癱患者只需要通過思考,就能自由控制假肢設備,這顯然比讓他們下達語音指令容易接受多了。

5.高度自動化的智能助理。這種BCI設備的更大作用,在於可以根據人們內心的想法直接完成多種任務,比如控制燈光、做閱讀筆記、下達VR遊戲指令,甚至可以用來控制車輛。

日產汽車已經推出了類似的耳機,來監控司機的腦電波。例如,一旦檢測到司機打算踩刹車,設備會在司機做出刹車動作之前就開始刹車,反應時間比人工操作快了多達半秒。甚至Facebook也推出了一個讀心術項目,研究讓用戶如何用腦電波發送Facebook Messenger資訊。

總而言之,這個極具想象力的技術,解決了一個長久以來的難題:如何化無形的意識為有形的信號,讓人類可以從身體這個“潛水鍾”的重重限制中透口氣。

不過實事求是的說,儘管技術正在慢慢走向成熟,但華美的理想要照進現實,還有很長一段路要走。

不能停歇的科技之翼

儘管學界和商業界都對這個“讀心術”趨之若鶩,但在實際應用中,這種語言轉錄的腦機接口還有很多隱患需要一一解決。

1.植入難度過大。技術推廣最直接的障礙就是,為了獲取精確的實驗數據,受試者必須通過開顱手術將電極植入大腦中的相關區域。侵入式的解決方案大大縮小了參與實驗的積極性,在實際應用中也會給植入者帶來排異、感染等不可預測的風險。

2.詞匯數據量不足。腦電波-語音的轉錄效果依賴於大規模的詞匯表,但每個參與者對同一語言到神經元的映射都各有不同,因此AI系統學習和推斷到的結果很難被通用。只能為不同的參與者特別定製屬獨屬於他們的思維語料庫,才能保證轉錄的準確性,難以大規模普及。

3.商業化難題。設備的植入難度與系統的定製化所帶來的大量門檻,決定了它只能在極為小眾的應用群體中發揮價值,比如少部分重症患者和一些狂熱極客。

4.倫理困境。即使補全了設備和系統的缺陷,想必也很少有人願意在公眾場合戴上這樣一套設備,而別人也很難不覺得被冒犯。

這有點像Googleglass剛問世的時候,只有設備,卻沒有形成相對應的行為規範,導致很多人擔心和質疑其侵犯隱私。同樣的,腦電波“讀心術”是否會帶來隱私或另一種不公平呢,恐怕還需要大量的社會學研究來支撐。

總而言之,儘管“AI讀心術”很容易就讓人感受到它的社會價值和商業潛力,但應用度上顯然還存在不少問題,想要靠腦交流,少說還有幾十年的路要走。

它帶給我們更多的,可能是作為一種高度可行性的解題思路,如果人類的肉身注定要像潛水鍾一樣緩慢地沉入深海,至少可以讓“思維”這隻蝴蝶,多擁有一刻自由。

獲得更多的PTT最新消息
按讚加入粉絲團