揭秘撒貝寧“孿生”AI虛擬主持人：用約30分鐘打造

近日，觀眾欣喜地看到在央視網絡春晚舞台上，撒貝寧有了個虛擬孿生兄弟“小小撒”，這是AI虛擬主持人首次上崗與原型同台秀技，這讓小撒很是感慨——正在直面自己的未來職業危機。

據透露，打造這樣一個AI孿生主播，僅需約30分鐘。那麽，究竟其中有何奧妙之處？

如同原型孿生般逼真

是否見過，讓撒貝寧“無話可說”的主持對手？

只見，小小撒一出場，小撒就忍不住說：“我的天，感覺像照鏡子一樣。”甚至從外貌上看，直呼簡直就是“失散多年的孿生兄弟”。

而小小撒也並非花瓶擺設，很能掌控現場，妙語連珠，幾乎不留余地。以至於一旁的小撒“委屈”地插話：“能給我說一句嗎？”

顯然，與以前僵硬、機械形象的虛擬人技術相比，引入人工智能，按真人原型架構出的虛擬主持人，在技術上有了相當大的提升。

“為了與真實的主持人有所區分，技術團隊在形象設計上做了一定程度的變化。比如，這次可愛的‘小小撒’個頭要高一點，更健談些。”美國人工智能公司偶邦(ObEN)聯合創始人鄭毅向科技日報記者介紹說。

當然，小小撒也並非獨家打造，因為節目中除了虛擬孿生撒貝寧，其他主持人朱迅、高博、龍洋的孿生AI主持人也都紛紛亮相。

本世紀初，英國廣播公司發布第一個虛擬主持人Anaova之後，虛擬主持人成了一個科技研究熱點。“能聞其聲，也見其人”，今年網絡春晚可謂是這一技術在國內首次大規模應用。

用數據“餵養”長大

常言道，“台上一分鐘，台下十年功”。而此次培養虛擬主持人的過程卻大大提速。

記者了解到，打造這樣一個AI虛擬孿生主播的技術叫作PAI(Personal AI)，在20多項專利申請技術的支撐下，只需撒貝寧等主持人的面部掃描和半小時的錄音數據，即可生成形象和聲音模型。

“在AI語音技術的基礎上，無需主持人錄入大量文本建立語音數據庫。只需其較短的幾十句標準原聲，通過特徵參數提取，利用遷移學習算法即可建立其獨特發聲模型。由此，任何輸入的文字都可用主持人的聲音讀或唱出來，甚至能運用中日英韓四種語言。”鄭毅說。

據介紹，隨著越來越多的數據“餵養”，小小撒在成長中會掌握更多技能，甚至包括小撒的喜好、說話方式等，在另一層面上與其更為相似。再加上動作捕捉訓練，以及傳感器及運動跟蹤設備，更突顯了原型主持人的個性化特色，大大增強辨識度。

“現在的深度學習和機器學習，是在原有自動化規則上多了學習能力——自己發現規律。換言之，由於人類很難發現規律中的細節，而AI可通過大量訓練讓電腦學習去發現內在規律及細節。”華為人工智能算法工程師張侗冬告訴記者。在某種意義上，正如主持人朱迅所言，“通過數據載體的形式，跟真實世界親密互動，我們實現了‘永生’。”

從數字世界到人類世界的鴻溝

未來的世界是平行的數據世界，社會的主角是人，數據世界的主角是數字化的人。那麽，在人工智能時代，虛擬主持人有什麽發展瓶頸？

鄭毅指出，“‘情感’是人類的專利。從語音模擬到語意模擬，虛擬主持人面臨從數字世界到人類世界的鴻溝，儘管其在模仿音色、語速、停頓時都沒問題，但是知道意思、怎麽回答，卻不理解感情內涵，要做到抑揚頓挫目前還很難。”

據介紹，語意學習，雖然也有“興奮”“悲傷”“著急”等情感模型，但在模擬過程中，虛擬主持人不能及時調動，需要人工參與。虛擬人仍然像個嗷嗷待哺的嬰兒，人類如何孕育它成長，為其構築怎樣的世界觀，將是未來深入探索的方向。

鄭毅表示，相信AI虛擬主持人不僅是一個技術產生到技術落地的過程，也是一個信任交接的過程。當初突破虛擬主持人技術的一大初衷，是想通過主持人、明星這樣有一定公信力人物的帶動，增加人們對人工智能的信任。因為我們還處於技術成長階段，而未來人與人工智能的相處也應從信任開始，例如未來像公務繁雜的職場人，如果擁有一個數字化的另一個自己，模擬自身意願，便可代勞成為貼心助手，打理日常瑣事，是不是會讓生活省心很多？相信人工智能可以給我們帶來更多生活便利，創造更好的生活。

有業內人士評價說，今年網絡春晚中AI應用的一小步，可能將會帶來掀開虛擬主持人時代的一大步。“當然若虛擬人上崗，工資依然發給我們人類就好。”有人戲稱。