每日最新頭條.有趣資訊

深度 | 殺死那個人類同傳

是誰在人為加劇機器和人類翻譯的對立?

2018年9月20日,知乎上一篇圖文並茂的文章,將人們對“機器翻譯”的質疑,再次置於放大鏡下。

文章作者Bell Wang,一名同聲傳譯工作者,指責著名的人工智能公司——科大訊飛在一場由他擔任同傳的會議上,沒打招呼,就直接把他和搭檔口譯的內容語音識別成了文字並打到大螢幕上。而螢幕上顯眼的“訊飛聽見”logo,給了現場觀眾很大的誤導,讓人以為這中文字幕是機器翻譯軟體直接翻譯得出的。

這篇文章迅速發酵,作為上市公司的科大訊飛不得不出面回應,強調自己“從沒有說過要取代人類”,沒有主觀惡意。在連續的幾場發布會和新聞稿中,高深莫測的“人機耦合”概念再次被科大訊飛拿出來,用於解釋他們的機器翻譯理念。

機器翻譯是為了幫助人類翻譯的,科大訊飛說。

儘管如此,同傳界對科大訊飛的負面觀感,並未因此減退。

PingWest品玩採訪了多位同傳從業者,他們普遍對科大訊飛缺乏正面印象。這並是不來自“機器翻譯搶走人類飯碗”的擔憂,而是源於包括科大訊飛在內的一眾“機器翻譯公司”,對同傳從業者“缺乏起碼的尊重“。

在這種糟糕的互動關係背後,自人類有文明交流以來便出現的語言翻譯,正在走向兩個分岔路。

公然羞辱

2017年底,美國前總統奧巴馬來到中國參加了一場企業峰會。這場會議後來因大量流出的“微商握手奧巴馬”圖片而走紅。不過在這場走穴現場,真正的主角是科大訊飛。

入行5年的同傳譯員喬亞(化名)是當天會議的同傳之一。會議即將開始前,現場一片混亂,一名主辦方工作人員匆匆找到正在做最後準備的喬亞和她的搭檔,說“科大訊飛也會來”。主辦方告訴她們,科大訊飛在會上會把她們的同傳用語音識別技術展示在大螢幕上,提醒她們翻譯時要“小心一些”。

在當天這場”寸時寸金“的活動上,主辦方安排了多場路演,但由於時間把握的問題,幾個講者在演講末尾不得不提高語速,最終快到同傳無法及時翻譯。“所以一個直接結果就是,當時螢幕出現長時間空白,不一會兒科大那邊就直接把螢幕關了。”

活動結束時喬亞一度擔心自己的翻譯完成度,擔心客戶會不滿意。但接下來的一幕卻讓她更加憤怒:

活動全部結束後,科大訊飛的一名高層突然蹦到台上,對奧巴馬驕傲地說到:“今天我們在螢幕上看到的實時字幕,都是科大訊飛的翻譯技術做的同傳。”

而在當天的活動全程中,科大訊飛自始至終沒有和譯員有過任何接觸。

這樣的做法與 Bell Wang 在知乎熱文裡吐槽的行為如出一轍,而PingWest品玩採訪的多名同傳都表示,自己也受到過相似的待遇。

張偉是一名從事同傳8年的譯員,他記得在至少兩次他同傳的活動中,現場嘉賓在發言中突然脫稿說,如果他當天帶來了自己公司的翻譯產品,就不需要今天的同傳了。而更加諷刺的是,作為現場的同傳,他還需要把這些言論翻譯成英文告訴老外觀眾。

“第一次遇到這種場景的時候我特別氣憤,但作為譯員我們要保持客觀,我還是給他翻了。當時我和搭檔互相看了一眼,兩人滿臉的抵觸。”

如今國際化的科技大會越來越多,那些擁有翻譯技術的科技公司嘉賓,總是喜歡拿就在現場的人類同傳說事,並且對這種近乎公然羞辱的行為自我感覺良好。

在接受採訪的多名同傳的描述中,這些機器與人共存的場合,沒有協同工作,也沒有同場競技,有的只是荒謬的鬧劇, Bell Wang 吐槽的這一次與他們經歷的並沒有什麽區別。唯一的不同只是,這一次事情“鬧大了”,不再隻局限於同傳圈子。

“業內的朋友們也開始在我身上寄托很多期望,希望維護合理的權利和訴求。” Bell Wang 在自己帖子引發巨大反響後這樣說到。

“從業者越來越浮躁”

中國人對科技的熱衷,讓“AI取代人類”成了所有人掛在嘴邊的話題。說的多了,許多”震驚體“的標題,也開始被所有人嚴肅對待。

如今你時不時就會在網上看到“AI取代同傳”樣式的標題,在張偉印象中,同傳圈第一次集體因此憤怒是2013年,當時中國移動的前董事長王建宙在央視接受採訪,他強調4G帶來傳輸速度的飛躍將大大提升機器翻譯的速度,進而替代人類同傳。

“如果4G讓做同聲傳譯的失業了,那我們這個行業就太高興了。” 王建宙隨口一說,同傳們焦慮許久。

小L是一名入行不到4年的年輕同傳,她的生活節奏代表了最典型的同傳譯員。我在她上下午兩場活動的間隙見到她:一身嶄新西裝、腳踏高跟鞋,但依舊走路生風。雖然過往一周每天都在“接會”(擔任會議的同傳),但在她化著淡妝的臉上卻看不到絲毫疲態。對這種快節奏的生活,她早已習慣。“這是做同傳的常態。”她說。

在大部分時間裡,她都保持著職業的微笑,只是當談及AI翻譯的話題時,她皺起了眉。

在此次科大訊飛的風波之前,機器翻譯就曾在主流輿論中引發過一次熱議。今年4月的博鼇亞洲論壇上,騰訊的機器同傳產品“翻譯君”高調亮相。

小L記得,在博鼇論壇開幕前,她以前合作過的一個客戶給她轉來一篇文章,內容是騰訊為”翻譯君“亮相而發布的新聞稿,但題目則被多家自媒體改作“AI即將取代同傳”。

“他什麽意思?以後不需要和我合作了?”小L心裡想,當時感到有點慌。不過之後的進展讓她松了口氣。

在那個熱鬧的大會上,“翻譯君”僅用幾天時間就從“業界首個完整AI同傳服務”,迅速淪為一個錯誤百出的蹩腳翻譯,諸如“我們需要一張臉,一張新的臉”的翻譯讓人哭笑不得,整體聽下來也是磕磕絆絆,基本無法通過它弄清楚現場在討論些什麽。

騰訊翻譯君在博鼇論壇的同傳首秀並不順利

小L覺得可笑,但緊跟而來的則是憤怒。

“同傳這個行業向來是靠實力說話,你的翻譯水準、你的情商,都很重要。”小L說。“但現在突然間機器翻譯來了,誰都還沒看過它們真的翻出什麽成果,或者真的證明比我們人類優秀,但是一瞬間我們所有人類同傳就是多餘的了,連比較一下都不用。這感覺很不爽。”

小L2014年讀研期間開始跟著老師參加會議的同傳,正式入行。但畢業後的前2到3年,做為新人,每個月最差時可能就只有2到3場會,天天都很著急。“每一個機會都要十分珍惜,如何讓客戶滿意,跟翻譯公司維護好關係,讓他們在下一次有會的時候能想起你。然後自己還要強迫自己每天都練習聽力和翻譯。總之挺不容易。”小L回憶說。

但同傳是翻譯行業的塔尖,而且同傳本身也是一個金字塔型的行業,進入頂端才有機會,因此小L削尖了腦袋也要擠進去。“我從不怕和同學、前輩競爭,有機會總是會觀察其他譯者,甚至是我的搭檔,從她們的長處學習,同時也知道他們的毛病在哪。”

而這一切到了機器翻譯那,卻可以不戰而勝。越來越多科技公司在宣傳時都把“同傳”當成自己機器翻譯技術的靶子。

“很多時候機器犯的錯誤對人類同傳來說就是災難,比如我看到過機器翻譯在一家公司年會現場把人家公司名稱翻錯,在國際論壇把地名翻錯,再比如博鼇這次,連一帶一路這樣的詞語也敢翻錯。”小L說。

她覺得,這與同傳整體的低調有關:與坐在台前和講者肩並肩的交傳不同,同傳往往“躲”在現場的某個角落,同時同傳譯員大多是自由職業者的工作狀態,獨來獨往,競爭激烈,沒有什麽抱團的習慣,也不太集體發聲。

“也許因為我們總坐在角落的箱子裡,他們不知道我們的態度吧。所以這些公司總是把同傳做為宣傳中瞄準的對象。但這些動輒’替代同傳’的言論,其實是一種缺少尊重的表現。”小L說。

和會場徹底隔絕開的同傳箱

“機器翻譯水準這麽差,但還把同傳做靶子,也是因為同傳是最高水準,而且也算是一個高薪的工作,說用機器取代我們會更有噱頭,有利於他們吸引關注。而且對於那些上市公司,還有利於抬升股價。”喬亞認為。

而張偉則感到困惑,他從行業估值角度估算了一筆账,認為就算機器真能取代人類同傳,同傳這點市場也不值得科技公司花費如此巨大的投入。

“我算了一下,同傳市場按照2000名譯員、每名譯員每年150場會,每場按照現在平均水準,譯員5000元、翻譯公司拿另外的5000元,那這樣就是30個億。再加上同傳設備的租賃費大約50個億,這已經是很高的估計,但也才多少。”張偉認為,就算把他估計的數字乘以10,也根本不值得這些科技公司大張旗鼓地做。

“我看,同傳這個概念算是被這些科技公司做市場行銷的給‘綁架’了。”小L憤憤地說。然而,儘管看不上機器翻譯現在的水準,但小L承認,她也不確定未來10年機器翻譯會發生怎樣的變化。

這種鋪天蓋地的宣傳已經開始影響同傳行業裡的每一個人。

喬亞目前還在一所高校兼職教授同傳課程,她記得在給一個研究生班上的第一節課上,這些未來的同傳主力軍關心的最多的話題也是“AI這麽強大,我們還需要學習同傳麽?要不要趁早改行”。這讓她哭笑不得。

而張偉認為這很容易理解。“按照現在這樣的發展,未來10年真的不好說。而這些20多歲的學生,10年後正進入事業黃金期,誰都不想在那時候被機器取代,丟掉飯碗。”

一方面親眼看著如今機器翻譯的糟糕水準,但另一方面卻又停不住的感到擔憂,如此糾結往複成了同傳們生活的一部分,給本就壓力不小的生活平添更多煩惱。

小L發現,這幾年關於AI取代人類同傳的討論已經取代了所有與業務相關的討論,成為行業內唯一持久的熱議話題。

“以前還安安靜靜討論討論接會和做翻譯的業務經驗,現在網上和群裡就都是討論AI又幹了什麽。”小L說。“天天想這個,讓從業者都顯得越來越浮躁了。”

人類和機器互不理解

在瞄準同傳這一行業的同時,這些機器翻譯技術的研發者們對同傳的理解卻與擁有百餘年發展史的同傳這一工種有很大不同。

在被問及科技界對常常提到的“機器同傳”的定義,微軟首席語音科學家黃學東對PingWest品玩表示,他們的理解更多是指語音識別與機器翻譯的結合。他表示,如今在語音識別上由於抗噪的能力還有所限,這一點比人類是要差點。但機器翻譯方面,它的速度絕對是人類比不上的。

小L就認為,同傳不是機械地翻譯,而是要保證溝通,達到交流的目的。“這些AI翻譯公司所說的同傳,和我們從事的同傳,完全就是兩個事情。”小L說。

科大訊飛在此次風波過後的回應中提到“人機耦合”的獨創概念。“人機耦合翻譯模式,由機器提供語音轉寫和翻譯結果給同傳參考,輔助同傳降低工作強度並提升效率,文字展示區Logo顯示為‘訊飛聽見’。”

但這種服務同傳譯員的說法,看起來卻基本是一廂情願。

根據業界的定義,同聲傳譯是指譯者用一種語言把另外一種語言所表達的內容,以與發言人幾乎相同的速度,用口頭形式準確表達出來的一種口譯方式 。

“同傳需要很強的聽力,正確判斷講者的停頓,需要做順句驅動,也就是和講者同時開口並隨時調整邏輯確保基本同步且準確。”張偉介紹。“而機器現在就只是譯一句喘一兩分鐘,這是假同傳。”

“同傳已經成功運行百來年,不須要這樣的支持。有些翻譯軟體其實就挺好用,利用人工智能把資料用兩分鐘譯好,關鍵詞譯的也非常準,這種人工譯員確實可以利用。”張偉說。“但人機耦合就是個偽命題,因為同傳工作路徑與訊飛的工作路徑平行,這怎麽耦合?好比兩列齊頭並進的火車,同傳譯員邊聽邊譯,人工智能識別採用的信號起始點與譯員的起始點一模一樣。你不比我們快,你的車頭不可能站我們前邊拉火車。而站我們後面,我們又不需要你了。”

而且,無論是科大訊飛還是騰訊的翻譯君,在這幾次會議同傳中,都沒有任何輔助人類同傳的行為。

一位曾在博鼇大會與騰訊翻譯君“一同”為觀眾提供同傳的譯員,曾對PingWest品玩回憶當時的工作場景:“會場內有一塊螢幕,會出AI同傳字幕,而人類同傳譯員照例坐在會議室後面角落的同傳間裡,根本看不到。工作時不可能再分心去關注它,也更沒有‘共同工作’的情況。可以比喻成兩套班子同時工作。我們也是從社交媒體上看到有關報導才知道有騰訊的產品在現場的。”

而在科大訊飛此次的風波中,訊飛聽見系統只是把同傳的聲音轉為文字,不僅提不上幫助,而且更多是在依賴人類同傳。而且這種語音轉字幕功能在同傳場景下更顯的奇怪,炫技的成分多於解決實際需求的作用。

“現在很多所謂AI同傳在會場的實現方式都是打字幕,這樣的設計明顯是反人類的,可能更適合聽障人士。因為人們通過聽力可以獲取更多資訊,而且還能邊聽邊把眼睛用在別的地方,比如看看PPT,或者看著本子記筆記等等,用來看字幕就太奇怪了。”

“從我的觀察來看,這些機器翻譯技術公司裡,應該是沒有哪怕一個懂同傳的人來幫他們提供建議。”張偉說。

PingWest品玩採訪的多名不同背景的同傳都表示,沒有聽說有翻譯、同傳等專業背景的人進入科技公司參加機器翻譯研發的工作,而他們也都沒有和研究機器翻譯的人員有過什麽直接交流。

科大訊飛翻譯業務的負責人翟吉博曾對PingWest品玩介紹,他們的團隊中也有翻譯出身的人,但具體的職責僅僅是測試,對系統進行評估,製訂些標準。也就是並不會參加到最核心的討論中。據PingWest品玩了解,微軟、搜狗等公司情況也類似,翻譯技術團隊多以機器學習、大數據等專業背景的專家為主,很少有傳統英語學科背景的人加入。

但事實上,雙方的這種”絕緣“並非一直如此。

最早在上世紀70年代,基於規則的機器翻譯理論最早被提出,也被稱作傳統的自然語義方法,它屬於最初的AI研究流派之一:“symbolic AI”。這種方法實現翻譯的方式是,把所有英語和中文語法規則和一整本英語詞典及一整本中文詞典編碼進機器,之後輸入英語句子後,機器就對應地得出一句中文。

這其實是嘗試模仿人類對語言的理解。“傳統的自然語義方法是按照人類的理解來理解。”黃學東對PingWest品玩表示。當時最初的機器翻譯研究者,經常需要向語言學專業的專家請教,共同研發。

但之後,到了90年代,基於統計的方法被應用到機器翻譯領域,並給翻譯效果帶來巨大的躍升。研發者也紛紛轉向基於統計的機器翻譯方法。這種方法更像是純粹的電腦方法,已經與傳統自然語義方法有很大不同,也不再對研究翻譯和語言學等學科的人們有太多依賴。

而進入最近5年,深度學習再次推動機器翻譯的進步。2011年谷歌開始研發和使用的“神經網絡”模仿人類大腦由神經元構成的結構,每一層神經網絡都會對數據進行分析以找到其中存在的規則,多層的神經網絡則類似現在流行的深度學習概念,可以發尋更多的範式。2016年,谷歌將神經網絡用於其翻譯產品上,再次大大提升了翻譯品質,逐漸成為現在各家科技公司機器翻譯技術的主流。

至此,機器翻譯的邏輯與人類進行翻譯的方法分別走向兩條岔路。

不確定的未來

“機器翻譯的算法和人類思維很不同。”黃學東說。“簡單形象地描述,機器翻譯是把一種人類語言投射到一個數字化的高維太空,然後在此進行解碼,解碼成另外一個語言。這個太空高維到人類不可想象。”

“機器翻譯和人類翻譯的邏輯很不一樣,其實對於我們來說,也沒必要去研究人類同傳或翻譯的邏輯,關鍵的是算力和數據。”一名在國內科技企業負責機器翻譯團隊的產品經理對PingWest品玩表示。

黃學東也表示,提升機器學習的品質,要靠高品質的數據、不同的算法模型以及性能完善的軟體系統。他表示,今年3月微軟的機器翻譯系統在一個中-英新聞測試集上,達到了可與人工翻譯媲美的水準。此次突破主要依靠的就是機器學習組新研發的對偶學習、推敲網絡等模型,其中不少都是受人類工作模式的啟發。

但是,雖然每個模型的原理都能說清楚,靈感也可能是在模仿人類,然而融合了這些模型的端對端系統則是一個超大的神經網絡黑箱。它會自己把機器翻譯的模型學習出來,外部很難弄清楚裡面發生了什麽。這樣的方式也讓機器翻譯存在著不可解釋性。

在此前博鼇論壇出洋相後,騰訊就對其中出現亂碼的情況進行分析,最終給出的解釋便是:“出現這種情況主要是包括神經網絡機器翻譯在內的深度學習算法,在原理上或多或少都有一定不確定性,在特定的情況下有一定的概率引發翻譯偏差。”

而這些在機器翻譯研究者眼中已經習慣的“特性”,對於普通人來說則可能帶來擔憂。小L就對機器翻譯領域大量的晦澀術語十分反感。“我對機器翻譯只有很簡單了解過,我看不懂那些複雜的算法和技術。”小L說。“但是我很反感這些公司在犯錯的時候拿什麽不確定性或者其他聽起來很嚇人的AI高級術語來搪塞。”

小L形容,每每聽到科技公司不斷宣傳“只要數據足夠多,就能訓練出與人一樣水準的翻譯”時,就好像聽到猴子足夠多就能寫出莎士比亞全集一樣,初聽荒謬可笑,細想卻感到嚇人:“如果失控了怎麽辦?”

除此之外,一些以翻譯為終生事業的人們還在思考,人類與機器在對待語言和翻譯這件事上的不同,會帶來什麽後果?

人類學習外語時,以理解這門語言為目的,但機器看起來則僅僅是完成了從輸入到輸出的任務,在不少語言學者的眼裡,它似乎永遠不能算是“懂得”了一門語言。

“這是個非常好的問題,有各種各樣不同的觀點。”黃學東表示,機器翻譯過程中,就是從低維太空到高維太空的投射過程,從電腦角度講,它就是理解了這個語言。反過來說,機器在高維太空非常得心應手,但對於我們人類又是不可理解的。”

“人類的語言和機器的語言是不一樣的,而我們現在用了一種機器可以理解的方案,來完成人類語言的翻譯,它的效果遠比基於人類知識結構方法來設計的機器翻譯,要好很多。”黃學東說。“這就是理想與現實的差距。”

“其實我們人類還不是也一樣,誰也說不清到底人腦是怎麽運行,但我們不是一樣在依賴它?那如果有一天我們訓練的機器可以穩定輸出,媲美人類,那為什麽不能依賴機器呢?”上述產品經理對PingWest品玩說。

就這樣,AI繼續吃進大量的數據、補充各種新鮮的模型,從而自我進化,然後參加機器翻譯的比賽,用科技界自己設立的標準來衡量著進步程度;另一邊,人類同傳則繼續提升自己對語言的理解,磨練自己的翻譯技巧,像傳統的手藝人一樣把這種工匠技藝傳承下去。而且,兩者並不怎麽溝通。

人類自有文明交流以來便伴隨出現的語言翻譯這件事,正走入兩個分岔路。兩者就像在兩個平行宇宙運行,何時會重合?還是會帶來衝突?

目前沒人知道。

創業開始是不是就要做品牌?

品牌和行銷究竟有什麽關聯?

品牌在商業競爭中的作用是什麽?

……

這些問題困擾著創業者們,品玩Live特地甄選光澗實驗室出品的《初創團隊如何快速規劃品牌》課程,幫助大家在最短的時間用最小的成本獲得切實可行的品牌工具。

該課程邀請了有20年行銷經驗的藍色游標副總裁,首席策略官Yorf郭耀峰,通過 2 個小時、9 節課、100+頁PPT,深入分析品牌在初創階段和業務增長、商業價值、商業競爭之間的關係並提供具體的工具。

快掃描下圖二維碼報名學習吧!

獲得更多的PTT最新消息
按讚加入粉絲團