每日最新頭條.有趣資訊

AI合成主播亮相世界互聯網大會 “搜狗分身”技術引關注

全球第一個全仿真智能合成主持人——“AI合成主播”現場演示。中國網記者 董寧 攝

中國網訊 (記者 董寧)11月7日,第五屆世界互聯網大會在浙江烏鎮拉開帷幕,搜狗與新華社合作開發、全球第一個全仿真智能合成主持人——“AI合成主播”正式亮相。而隨著“AI合成主播”的發布,搜狗未來人工智能的核心技術“搜狗分身”也終於浮出水面。

在發布會現場的體驗中,觀眾只要輸入一句既有的新聞文本,螢幕上就會出現一位合成的新華社新聞主播,他不僅會用和真人一樣的聲音進行播報,連唇形、面部表情也能完全吻合。

據了解,在合成主播的開發過程中,在“搜狗分身”技術的支持下,通過人臉關鍵點檢測、人臉特徵提取、人臉重構、唇語識別、情感遷移等多項前沿技術,並結合語音、影像等多模態資訊進行聯合建模訓練後,“AI合成主播”正式誕生。

隨著“AI合成主播”系統的成功上線,支撐其正常運轉的核心“搜狗分身”也引起了大家的廣泛關注。據搜狗公司智能語音事業部總經理王硯峰介紹,“搜狗分身”技術是搜狗人工智能的核心技術之一,誕生於搜狗“自然互動+知識計算”這一人工智能理念之下。該技術能夠利用搜狗的AI能力,從影像表情,聲音語言習慣,邏輯思維等層面對AI進行擬人化訓練,然後克隆製造人類的AI分身,進而幫助人類提高資訊表達和傳遞的效率。

以“AI合成主播”為例,該產品使用主播的真人形象,配合“搜狗分身”的語音、合成等技術模擬真人播報畫面,使大眾享受到逼真度極高的影像效果。這種播報形式,突破了以往語音影像合成領域中,只能單純創造合成形象,並配合語音輸出唇部效果的約束,極大地提高了觀眾資訊獲取的真實度。同時,利用“搜狗分身”技術,“AI合成主播”還能實時高效地輸出音影片合成效果。在“搜狗分身”技術的支持下,使用者通過文字鍵入、語音輸入、機器翻譯等多種方式輸入文本後,將獲得實時的播報影片。這種操作方式將極大減少新聞媒體在後期製作的各項成本,讓新聞影片的製作效率有了極大的提高。

“搜狗分身”技術實現了在不同場景下更為自然的人機互動,除了在媒體融合領域的應用外,未來還將在娛樂、醫療健康、教育、法律等多個領域提供個性化的內容。

搜狗公司CEO王小川、新華社副社長劉思揚等嘉賓共同啟動全球首個AI合成主播。中國網 董寧攝影

獲得更多的PTT最新消息
按讚加入粉絲團