每日最新頭條.有趣資訊

揭秘撒貝寧“孿生”AI虛擬主持人:用約30分鐘打造

近日,觀眾欣喜地看到在央視網絡春晚舞台上,撒貝寧有了個虛擬孿生兄弟“小小撒”,這是AI虛擬主持人首次上崗與原型同台秀技,這讓小撒很是感慨——正在直面自己的未來職業危機。

據透露,打造這樣一個AI孿生主播,僅需約30分鐘。那麽,究竟其中有何奧妙之處?

如同原型孿生般逼真

是否見過,讓撒貝寧“無話可說”的主持對手?

只見,小小撒一出場,小撒就忍不住說:“我的天,感覺像照鏡子一樣。”甚至從外貌上看,直呼簡直就是“失散多年的孿生兄弟”。

而小小撒也並非花瓶擺設,很能掌控現場,妙語連珠,幾乎不留余地。以至於一旁的小撒“委屈”地插話:“能給我說一句嗎?”

顯然,與以前僵硬、機械形象的虛擬人技術相比,引入人工智能,按真人原型架構出的虛擬主持人,在技術上有了相當大的提升。

“為了與真實的主持人有所區分,技術團隊在形象設計上做了一定程度的變化。比如,這次可愛的‘小小撒’個頭要高一點,更健談些。”美國人工智能公司偶邦(ObEN)聯合創始人鄭毅向科技日報記者介紹說。

當然,小小撒也並非獨家打造,因為節目中除了虛擬孿生撒貝寧,其他主持人朱迅、高博、龍洋的孿生AI主持人也都紛紛亮相。

本世紀初,英國廣播公司發布第一個虛擬主持人Anaova之後,虛擬主持人成了一個科技研究熱點。“能聞其聲,也見其人”,今年網絡春晚可謂是這一技術在國內首次大規模應用。

用數據“餵養”長大

常言道,“台上一分鐘,台下十年功”。而此次培養虛擬主持人的過程卻大大提速。

記者了解到,打造這樣一個AI虛擬孿生主播的技術叫作PAI(Personal AI),在20多項專利申請技術的支撐下,只需撒貝寧等主持人的面部掃描和半小時的錄音數據,即可生成形象和聲音模型。

“在AI語音技術的基礎上,無需主持人錄入大量文本建立語音數據庫。只需其較短的幾十句標準原聲,通過特徵參數提取,利用遷移學習算法即可建立其獨特發聲模型。由此,任何輸入的文字都可用主持人的聲音讀或唱出來,甚至能運用中日英韓四種語言。”鄭毅說。

據介紹,隨著越來越多的數據“餵養”,小小撒在成長中會掌握更多技能,甚至包括小撒的喜好、說話方式等,在另一層面上與其更為相似。再加上動作捕捉訓練,以及傳感器及運動跟蹤設備,更突顯了原型主持人的個性化特色,大大增強辨識度。

“現在的深度學習和機器學習,是在原有自動化規則上多了學習能力——自己發現規律。換言之,由於人類很難發現規律中的細節,而AI可通過大量訓練讓電腦學習去發現內在規律及細節。”華為人工智能算法工程師張侗冬告訴記者。 在某種意義上,正如主持人朱迅所言,“通過數據載體的形式,跟真實世界親密互動,我們實現了‘永生’。”

從數字世界到人類世界的鴻溝

未來的世界是平行的數據世界,社會的主角是人,數據世界的主角是數字化的人。那麽,在人工智能時代,虛擬主持人有什麽發展瓶頸?

鄭毅指出,“‘情感’是人類的專利。從語音模擬到語意模擬,虛擬主持人面臨從數字世界到人類世界的鴻溝,儘管其在模仿音色、語速、停頓時都沒問題,但是知道意思、怎麽回答,卻不理解感情內涵,要做到抑揚頓挫目前還很難。”

據介紹,語意學習,雖然也有“興奮”“悲傷”“著急”等情感模型,但在模擬過程中,虛擬主持人不能及時調動,需要人工參與。虛擬人仍然像個嗷嗷待哺的嬰兒,人類如何孕育它成長,為其構築怎樣的世界觀,將是未來深入探索的方向。

鄭毅表示,相信AI虛擬主持人不僅是一個技術產生到技術落地的過程,也是一個信任交接的過程。當初突破虛擬主持人技術的一大初衷,是想通過主持人、明星這樣有一定公信力人物的帶動,增加人們對人工智能的信任。因為我們還處於技術成長階段,而未來人與人工智能的相處也應從信任開始,例如未來像公務繁雜的職場人,如果擁有一個數字化的另一個自己,模擬自身意願,便可代勞成為貼心助手,打理日常瑣事,是不是會讓生活省心很多?相信人工智能可以給我們帶來更多生活便利,創造更好的生活。

有業內人士評價說,今年網絡春晚中AI應用的一小步,可能將會帶來掀開虛擬主持人時代的一大步。“當然若虛擬人上崗,工資依然發給我們人類就好。”有人戲稱。

獲得更多的PTT最新消息
按讚加入粉絲團