每日最新頭條.有趣資訊

AI同傳,這次終於翻車了?

給AI偶爾潑潑冷水,絕對是件好事。

十幾個小時之前,一位現實職業是同傳(將外語快速轉化為英文)、中名叫“Bell Wang”的用戶,在知乎上直接以“科大訊飛,你的AI同傳操(qi)作(zha)能更風騷一點嗎”為題,揭露了一部分科大訊飛在會議同傳上的操作:

科大訊飛自己的英文轉寫(將語音變成文字)對於日本嘉賓的識別完全不佳;

科大訊飛沒有選擇自己的英文轉寫內容來直接翻譯,而是直接將女同傳的中文結果直接轉寫在螢幕上;

科大訊飛也將男同傳重新整理的“標準英語”記錄了下來,不僅轉寫成為了英文文字,同時還最終將這些文字以及機器發音的方式,配到了整個活動的回顧當中。

科大訊飛在整個活動隻標注了“AI智能翻譯”的字眼,並沒有任何提及人工介入的表示。

一石激起千層浪,關於科大訊飛的這種操作,很快就在同傳圈子裡激起了“巨浪”,基本都以討伐為主題。

一位業者向虎嗅透露,在很多同傳人的眼裡:“AI的確很可能終將取代我們的職業,但在AI真正全面超越人類之前,他們還希望爭取一下。”

這看起來只是科大訊飛,AI同傳行業自己的事,但放大來看,這就是AI在具體職業上不斷取代人類,人類不斷反抗的一個小片段。這樣的小片段,未來同樣發生在我們每一個人身上。

AI同傳的確“不太行”

通常來說,AI想要成功主要看三要素:數據、計算力、算法。後兩者在近年的“AI浪潮”中,得到了高速的發展,也讓真正的“門檻”變成了數據。

就好比AI已經徹底“打敗”人類的圍棋,後者就可以算是最規整的數據了——棋盤上只有361個位置可以下,也只有黑白兩種棋子。更不要提人類上千年來保留的數以千萬計數的棋譜。在AlphaGo最後超越人類那一步時,甚至還開始通過自我對弈來生成全新的數據。

翻譯其實也是一個擁有很多“優質數據”的內容——因為世界上很多的文學作品,都有不同語種的譯本。更不要提在線翻譯服務中海量的使用和反饋記錄了。所以文本翻譯這件事,也算是AI最早有所進展的領域了。

但同傳並不只是翻譯,更準確地說是“轉寫+翻譯”。相比格式規範,字母、單詞書寫方式都一樣的實體內容,英語的口語發音實際上要複雜的多。

以科大訊飛這次為例,演講嘉賓是一位名叫Toshio Fukuda的日本科學院院士。而日式英語,一直都是很“酸爽”的存在。虎嗅也找來了一小段這位日本院士的英語祝福。

您目前設備暫不支持播放

從11秒開始純正的日式英語,大家可以多聽幾遍嘗試著理解下內容

這位Toshio Fukuda教授的“日式英語”真的很純正,因為一般日本人都是直接用日語的“片假名”來學習外語的發音,你甚至可以說它一半屬於日語。

例如知乎用戶“端木異”舉的另外一個例子——preparation,日本人念為“霹靂啪啦頌”。

而事實上,英語這種國際通用語言,在結合各國的口音之後,已經衍生出了一大堆變化。感興趣的話,可以參考嗶哩嗶哩上的一段67種英語口音匯總影片。不僅日式英語,印度、俄羅斯等地區的英語也頗具特色。大家完全可以自己擋住字幕來理解一下內容。

至於科大訊飛自己的英語轉寫能力,想要檢驗也很容易,科大訊飛持股55%的“訊飛聽見”,就提供了上傳然後轉寫中英文的能力。虎嗅也找來了一段創新工場創始人李開複的TED演講,轉寫除了其中的一部分內容。

轉寫的結果還是比較令人滿意的,14分鐘的音頻只花了3分鐘轉寫,總計費4.89元

總結來說,一是“同傳”目前仍然是AI力所不及的一項任務,二是科大訊飛在較為標準的英語轉寫、翻譯中,其實還是做出了一定的成績的。

科大訊飛怎麽看“AI+人工”?

加入用“同傳+翻車+AI”作為關鍵詞搜索,輕鬆就能搜到50多萬條記錄。

而據虎嗅了解,其他國內會議AI同傳服務商,雖然沒有像訊飛這樣直接“人機結合”,但在實際操作中也有專門派人盯翻譯結果,甚至是在翻譯效果不佳時刷新頁面的操作套路。(隨時清空大螢幕上不好的翻譯結果)

而在今天負面爆發之後,科大訊飛方面也給出了自己的解釋:

科大訊飛向2018創新與新興產業發展國際會議提供會議轉寫服務,但考慮到大會專業技術背景,以及參會者來自不同國家、不同口音等情況,主辦方專門配備了專職同傳譯員。科大訊飛應主辦方要求僅需提供語音識別技術,直接轉寫譯員翻譯結果並在會場大屏呈現,同時合成語音供線上直播用戶理解,避免收聽不暢。

個別同傳譯員對於科大訊飛的誤解,我們認為僅僅是對會議服務方面的分工溝通了解不清;目前我們已經委託會議主辦方進行溝通,希望盡快消除誤解;自面世以來,科大訊飛的訊飛聽見智能會議系統等轉寫工具已經服務過眾多重要會議,其中就包括2017全國兩會、2018年4月博鼇亞洲論壇、2018世界人工智能大會等,服務品質頗受好評。

19號當天的主會場上,科大訊飛董事長劉慶峰在演講中還特別提到了訊飛機器翻譯人機耦合的模式:9月17日世界人工智能大會開幕當天,十幾個發言嘉賓中有三位嘉賓的演講用的是人機耦合(的機器翻譯模式),大螢幕隻顯示一種語言,剩下的嘉賓演講採用的是完全機器自動的轉寫,沒有人工參與。

隨著AI技術快速發展,我們能夠理解人工智能施於行業和個人的緊張焦慮情緒;但科大訊飛發展AI無意於替代任何職業和崗位,我們也多次強調“人機耦合”共同進步的立場和產品追求。

算是進一步對現場的情況作了更詳細的說明,還重複提及了科大訊飛早前提出的“人機耦合”概念。在去年科大訊飛官方公眾號的一篇題為《拒絕神化 人工智能技術需踏實前行》(2017年6月29日,閱讀量34216、點讚196)的推送中,還寫上了這樣的表態:

機器翻譯已經取得非常大的進步,在衣食住行等常用生活用語上的中英翻譯可以達到大學六級的水準,能夠幫助人們在一些場景處理語言交流的問題,但距離會議同傳以及高水準翻譯所講究的“信、達、雅”還存在很大的差距。

訊飛一直所努力的,是希望通過語音轉寫和翻譯技術幫助同傳提高工作效率、減少失誤,形成人機耦合的同傳新模式,並不是去替代同聲傳譯。

結合我們上文對於“同傳”難度的分析,訊飛這段表述還是很合理的。

那麽問題到底出在什麽地方呢?從知乎用戶“Bell Wang”的描述中來看,訊飛沒有明確當場說出自己的AI智能同傳業務中,存在真人的工作成果,或許才是最大的原因。

更深層次的,是隨著AI發展,已經對部分人類的職業產生了衝擊的事實。

每個人,都應該提前想想怎麽應對AI

還是回到科大訊飛這個“人機耦合”的例子來看,假如只看最終的系統效率,科大訊飛似乎說的在理。拿同傳來說,AI能夠完成絕大部分英語比較好、口音不重的轉寫和翻譯任務。而真人只需要應對日式英語、俄式英語這樣更棘手的任務。

從同傳業者的反饋來看,我們還是能清晰體會到他們對於AI的敵意。

當然,這也是再正常不過的,要成為一個優秀的同傳業者,你需要數年的學習,以及不斷的業務經驗積累。而對於AI來說,一旦集中資源訓練出了一個“神經網絡”,剩下的事情無非就是把這個“神經網絡”複製,和添加更多硬體算力。

但同時,同傳在可預期的時間內(十數年)又不能達成完全超越人類的能力(目前時效已經超越了,但是品質還差很遠)。最終形成了一個極度“尷尬”的境地——AI和人工各有所長,經濟和模式趨勢“逼迫”兩者必須合作。

在合作的同時,人類或許很難進一步提升自我,但AI卻會進一步成長、逼近。機器對此自然不會帶有情感,但人類卻會面對低等級的勞動力不斷被取代的“壓迫感”。

所以不誇張地說,我們是時候都提前想想自己怎麽和AI一起工作下去了。

獲得更多的PTT最新消息
按讚加入粉絲團