每日最新頭條.有趣資訊

科大訊飛陷AI同傳造假疑雲:從機器朗讀到翻譯有多遠

  科大訊飛陷AI同傳造假疑雲:從機器朗讀到機器翻譯還有多遠?

  本報記者  倪雨晴  廣州報導

  2018世界人工智能大會剛落幕,科大訊飛卻陷入了“AI同傳造假”的風波。

  9月20日,一位同傳譯員在知乎上發文稱,在上海的一場會議中,訊飛的翻譯其實為人工同傳,並非機器智能翻譯,並且譯文由機器進行朗讀。

  這容易讓觀眾產生“都是人工智能翻譯”的錯覺,而忽略背後同傳譯員們的勞動成果。對此,9月21日,科大訊飛的回復是,“科大訊飛從來沒有把同傳翻譯包裝成機器翻譯。”

  9月21日,科大訊飛董秘、高級副總裁江濤接受21世紀經濟報導記者採訪時說道:“儘管機器翻譯獲得發展,明年能達到英語專業8級的水準,但依然沒辦法代替同傳。科大訊飛沒有提到AI同傳,並沒有造假吹牛,目前的情況是一個誤會。”

  他進一步解釋道,科大訊飛的智能會議系統有兩種工作模式,一種是全自動翻譯,系統識別中文並轉化成英語、日語、韓語等同步顯示在螢幕上;另外一種就是在專業的會議上,直接獲取現場同傳的聲音,再同步到大螢幕上。“科大訊飛沒有做混淆,而同傳的對接是由會議主辦方聯繫的。”

  科大訊飛方面還提到,當機器同時提供轉寫和翻譯服務時,文字展示區Logo顯示為“訊飛聽見—離線翻譯系統”;機器僅提供轉寫服務時,文字展示區Logo顯示為“訊飛聽見”。訊飛聽見是科大訊飛旗下提供語音轉寫、翻譯的平台。

  儘管目前語音識別成為AI的先行領域,但是語音翻譯依舊是一大難題,現階段無法精準翻譯屬正常現象。據21世紀經濟報導記者了解,識別同傳的譯文在業內屬於普遍的做法,不少公司以此進行誇大宣傳。

  人工還是智能?

  談及人工智能時代,機器能否代替人工是關注焦點。在語音領域,科大訊飛表示,希望通過語音轉寫和翻譯技術幫助同傳提高工作效率、減少失誤,形成人機耦合的同傳新模式,並不是去替代同聲傳譯。而科大訊飛董事長劉慶峰在不同場合均表示,人機協同、人工智能+行業,才是未來人工智能最有希望做成的。

  在走向人機耦合的操作過程中,智能固然離不開人工,但是,雙方在配合工作中發生了“摩擦”。

  對於此次同傳譯者的“投訴”,Ledge同聲翻譯創始人王民傑告訴21世紀經濟報導記者:“除了用機器人的聲音把譯文讀出來不太普遍之外,其他(機器識別同傳譯文)都很普遍。對於外國人的英文演講,基本上采取的模式就是由我們人工同傳翻譯成中文,然後他們再把我們的中文從聲音轉換成文字顯示在大螢幕上。”

  “因此,同傳界的很多人都覺得是科大訊飛剽竊了我們的勞動成果,讓觀眾誤以為是機器在同傳,而不是人工同傳。”王民傑繼續說道,“但是我們在處理問題上也是兩難,我們希望科技能夠發展,幫助我們進行翻譯。但是現在人工智能被過度誇大,我們身份特殊,也擔心外界說自己由於害怕失業而進行攻擊。”

  王民傑的翻譯公司和科大訊飛合作密切,此次事件發酵後,他也向科大訊飛提出意見,希望對方在大螢幕上顯示他們只是語音識別,聲音來自同傳。

  另一位資深同傳譯者告訴21世紀經濟報導記者:“個人覺得機器代替人工同傳還要很長時間,人機結合更實際。”

  訊飛翻譯產品經理劉晨璿則向21世紀經濟報導記者複盤道:“事情發生在9月19-20日舉行的2018創新與新興產業發展國際會議上,我們向主辦方提供了兩種方案,一種是自動翻譯,另一種是對同傳語音進行識別,螢幕是轉寫的同傳語音,我們並沒有對此進行包裝。”

  也有人工智能業內人士告訴21世紀經濟報導記者,其實大家都用這種方式進行,有“偷換概念”的嫌疑。但是同傳譯者的知識產權有待商榷,一般其產權屬於雇用了同傳的公司。

  在近年來大眾對於人工智能、人工翻譯的期望頗高。而反觀公司,也有將產品“趕鴨子上架”的情況出現。當然,語音方面有不少成熟的解決方案,然而觀眾的預期和企業產品效果之間差異過大,也導致此次風波發酵。

  語音識別仍存瓶頸?

  在2017年,科大訊飛就曾表態:現階段人工智能技術發展不需要“被神化”。 “目前,機器翻譯已經取得非常大的進步,在衣食住行等常用生活用語上的中英翻譯可以達到大學六級的水準,能夠幫助人們在一些場景處理語言交流的問題,但距離會議同傳以及高水準翻譯所講究的‘信、達、雅’還存在很大的差距。”

  對於人工耦合,江濤告訴21世紀經濟報導記者,科大訊飛的人工智能系統會結合聽和看的資訊,也會針對關鍵詞進行解釋,相當於有一個助手在幫助譯者進行翻譯,降低了同傳口譯者的工作強度。而科大訊飛已經和上海外國語大學成立了研究院,探討人機協同模式。在本周的2018世界人工智能大會上,就有三個嘉賓發言采取了人工耦合的模式。

  應該說,科大訊飛在語音領域技術領先,但是仍面臨著不少瓶頸。

  首先從科大訊飛的產品技術方向來看,主要包括語音互動、機器翻譯、文本識別。其中,語音互動是科大訊飛的老本行,包括語音識別、語音合成等。另外,採用日趨成熟的自然語言理解,也為語音互動提供了更強的支撐。

  尤其是語音合成方面,科大訊飛在業界比賽中屢次奪冠。其通過機器學習提取聲音的特徵,通過聲學波形合成出仿真聲音。該技術的難點之一,就是如何能夠騙過耳朵達到真人說話的效果。

  但是在技術成熟的同時,仍有難題需要攻克。比如,遇到同音字識別、環境比較嘈雜的情況以及中文和英文夾雜的時候,語音的識別率就會下降。

  劉慶峰在2018世界人工智能上表示,科大訊飛是全球唯一在語音合成中機器超過人工的公司,在安靜的環境下,演講主題確定的情況下語音準確率高,但是多人說話噪音環境下的識別率是關鍵。在他看來,通過大規模後台服務集群,語音識別正在走向實用。同時,用戶也對方言、多人說話、安全保護等方面提出了新要求。

  一位人工智能從業者告訴21世紀經濟報導記者,自然語言處理技術需要得到攻克,這就涉及到機器的知識、情感、邏輯等能力。而這三個人類在幼兒時期就能掌握的機能,對於機器來說是難上加難。語音本身不是最難,但是語言背後需要人類的知識系統以及專業領域的能力,這些數據的掌握並非易事。而人工智能公司目前對翻譯的野心很大,短時期內系統性地解決還是較為困難。(編輯:包芳鳴)

責任編輯:陳靖

獲得更多的PTT最新消息
按讚加入粉絲團