每日最新頭條.有趣資訊

“媒體大腦”進博會顯露身手,短影片秒級生成

澎湃新聞記者 俞凱

中國國際進口博覽會新華社新聞報導中心。 澎湃新聞記者 俞凱 圖

對前方記者來說,中國國際進口博覽會既是一個“新聞富礦”,又是一個巨大挑戰——又要寫文稿,又要拍影片,如何才能忙得過來?

不過,中國媒體上馬的一條神奇的影片生產線,令首屆進博會的影片報導“如虎添翼”。這就是新華社自主研發的人工智能影片生產加工系統,又稱“現場雲”移動采編平台+“媒體大腦Magic系統平台”。

新華智雲聯席總裁傅丕毅透露,截至11月7日中午12點,新華社聯合13家參加進博會報導的媒體,運用“現場雲”移動采編平台,用手機邊走邊拍邊發,兩天半時間就已發出285條短影片,到當晚可突破330條。

“這些短影片在新華社客戶端的瀏覽量、點擊率也相當可觀,達到了‘秒級生成、海量生產、閱聽人喜歡’的預定目標。”傅丕毅透露。

最快的影片製作僅耗時6秒

那麽,這是如何做到的呢?

新華社新媒體中心透露,前方記者基於現場雲實時采集影片素材,即拍即傳,完成第一輪報導。之後,現場雲報導以素材形式進入Magic智能生產平台,經過人臉識別、語音識別、數據處理等AI工具,自動或人機協作批量生產短影片內容,這是第二輪生產。最後,審稿人對批量內容集中審核,稿件簽發後完成第二輪傳播。

新華社新媒體中心副總編輯賀大為表示,就進博會影片報導來說,采編發流程要具有快速批量處理能力。“現場雲”發揮了重要作用,它可以理解為媒體大腦Magic智能生產平台的前端應用和客戶端,300多位新華社記者可以在進博會各個現場舉起手機,按各種格式進行影片拍攝和采集,實現移動化的影片采集加工,供媒體大腦Magic智能生產平台進行後期的AI人機互動加工和生產。

現場雲移動采編發系統與媒體大腦Magic智能生產平台的合作,是一種智能化生產模式,首次在進博會這樣的大型報導上得到實戰檢驗。

傅丕毅表示,作為國內第一個媒體人工智能平台,新華社的媒體大腦Magic系統平台是在2017年的互聯網大會上宣布建成並向海內外媒體開放服務的,在2018年6月14日-7月16日的世界杯期間,總共生產製作了37581條短影片,佔央視、愛奇藝、優酷等短影片總產量的58.6%,平均每條短影片的生產時間在1分鐘以內,最快的一條世界杯進球影片製作出來僅耗時6秒。

“媒體大腦”編輯製作影片時的顯示畫面。新華社新媒體中心 供圖

不是取代記者而是解放記者

傅丕毅透露,以前影片記者每人每天的影片產出量平均為3條,按此測算,330條進博會短影片至少需要110人,如今這些人力都被機器節省下來了。

傅丕毅表示,本屆進博會應用的是媒體大腦Magic系統平台3.0版本,採用的人工智能技術主要包括人臉識別、語音分析、自動標注、視覺分析、自動合成、機器配音等,可運用人工智能技術對這些影片進行再加工,通過對影片畫面逐幀拆解和再組合,又生產出全新的影片。在語音識別上,目前國語的識別準確率已達97-98%,上海話識別率在70-80%左右,英語識別也OK,小語種暫時還不能識別。

“為確保安全,審稿流程也全部由人工進行嚴格把關,逐條審核通過,機器僅提供輔助。”傅丕毅強調,現場雲和媒體大腦Magic系統平台不是取代記者,而是解放記者,讓記者解放出更多時間去做更有創造性和思考性的工作。

新成員“AI合成主播”誕生

澎湃新聞從新華社新媒體中心獲悉,11月7日,在烏鎮舉行的第五屆世界互聯網大會上,新華社聯合搜狗又發布了全球首個虛擬主持人“AI合成主播”,運用最新人工智能技術,“克隆”出與真人主播擁有同樣播報能力的“分身”。

“AI合成主播”是通過提取真人主播新聞播報影片中的聲音、唇形、表情動作等特徵,運用語音、唇形、表情合成以及深度學習等技術聯合建模訓練而成。

該項技術能夠將所輸入的中英文文本自動生成相應內容的影片,並確保影片中音頻和表情、唇動保持自然一致,展現與真人主播無異的資訊傳達效果。

“真人”主播一天工作8小時,但“分身”能夠不知疲倦地工作24小時。只要小編們將文本輸入系統,TA們就能隨時工作,並且一直工作下去……

即日起,“AI合成主播”正式成為新華社報導隊伍中一員,用戶登錄新華社中英文客戶端、新華社微信公眾號、中國新華新聞電視網(CNC)、新華視點微博、新華社中國網事微博、新華社“微悅讀”小程式,都會看到“AI合成主播”的身影。

在傅丕毅看來,“AI合成主播”是媒體大腦家族的新成員,它的出現將讓真人主播得到徹底解放。

本期見習編輯 周玉華

獲得更多的PTT最新消息
按讚加入粉絲團