每日最新頭條.有趣資訊

腦機接口研究新突破,把心裡話轉換成語音播放

如何讓大腦思路清晰但患有失語症的人正常說話?現在有了新的研究成果。

近日,加州大學的研究人員在《自然》雜誌上發表的研究成果表明,他們所研發的人類語音合成系統,可以解碼人類下頜、喉嚨、舌頭、嘴巴等發音部位的生物信號,最終合成受試者想要說的話。

也就是說,這個腦機接口系統可以將腦活動轉化為語音,腦袋裡的意念不用自己動嘴說,可以借助機器合成的語音表達出來。

類似的研究早前也有人做過,主要是將腦活動直接解碼為語音。此次研究的突破之處在於解碼過程分成了兩步,並降低了語音失真率。

第一步,聲道、舌頭、嘴唇等發音部位的運動由大腦控制,為了獲得該過程腦信號與肌肉運動的關聯,他們訓練了一個 RNN 神經網絡對這個過程進行深度學習。

第二步,把發音部位的運動,轉換成合成的語音,這一步也使用了一個 RNN 神經網絡。

有業內人士認為,該項研究可以幫助因疾病喪失語言功能的人,其中包括肌萎縮側索硬化、中風等失語症患者。

著名科學家史蒂芬 · 霍金患有肌萎縮側索硬化,數十年間委身於狹窄的輪椅,患病後的他曾通過單個按鍵的滑鼠操作電腦打字,後來手部肌肉衰弱變,利用眼鏡上的紅外探測器識別眼球和肌肉的運動,最後通過語音合成器讀出文本。

這種用殘余肌肉控制機器打字的方式,雖然可以幫助患者對外表達,但速度很有限。要想讓失語症患者能夠流暢地表達,借助腦機接口和機器學習技術合成語音是一個有效的方向。

腦機接口(BCI,Brain Computer Interface)的相關研究從二十世紀八十年代就已經開始了,至今超過 30 年。

腦機接口技術主要是從大腦等神經中樞中提取特定的生物電信號,依據現有的認知神經科學理論進行解碼,在與外部系統建立聯繫和溝通。可以讓人與機器之間的協作達到「人機合一」的境界。

2004 年,布朗大學研發的 BrainGate 系統被植入到 13 個癱患者大腦的運動皮層中。這個系統可以監測植入者的神經元,如果被植入者想要做出移動手臂等動作,大腦中的神經元就會釋放電信號,BrainGate 再將這些電信號解碼傳送到人體外的系統。

BrainGate 已經讓一個四肢癱瘓的女士在無看護的情況下喝到飲料,還讓另一個四肢癱瘓的女士在飛行模擬器上駕駛 F-35 戰鬥機。

俄羅斯億萬富豪伊茨科夫於 2011 年創立了一個名為「俄羅斯 2045」的計劃,企圖打造人類的「不死之身」。這個計劃有個基金的時間表:到 2020 年,要實現人腦對機器人「化身」的遙控;到 2025 年,要把人腦移植到機器人身上;到 2035 年,要破解人類大腦之謎,打造出「人造大腦」;到 2045 年,要創造出真實版的全息「虛擬人」。

這個人類永生計劃的技術關鍵,就是腦機接口。

就目前而言,像《黑客帝國》或者《阿凡達》這些科技電影所呈現的腦機接口技術依然很遙遠,不過這項技術已經逐漸在臨床上用於恢復人體部分功能喪失。

獲得更多的PTT最新消息
按讚加入粉絲團