每日最新頭條.有趣資訊

為了重建巴別塔,Google 最近挺努力的

為了重建巴別塔,讓人類可以更突破語言障礙與全球實現互聯,Google 最近在翻譯方面的更新很努力。

▲ Google Pixel Buds

首先,Google 的無線耳機 Pixel Buds 宣布,其獨有的翻譯功能,將向全體支持 Google Assistant 的耳機開放。

這意味著,BOSE QuietComfort 35 II、索尼 WH-1000XM3,還有 JBL 一系列支持 Google Assistant 的產品,獲得翻譯這個技能點後,都將在我們的耳邊搖身一變成為翻譯器。

▲ Google Pixel Buds 翻譯功能的語言支持

這個功能支持 40 種語言的實時對話翻譯,帶上耳機後通過耳機呼出 Google Assistant,並對其說「翻譯」就能使用。

國內使用支持 Google Assistant 產品的用戶應該不算多,但使用「Google 翻譯」這個 app 的用戶一定不少。

「Google 翻譯」宣布從 10 月中旬開始,相機翻譯功能將陸續新增支持 13 種語言,分別為阿拉伯語、泰語、越南語、印地語、孟加拉語、古吉拉特語、卡納達語、馬拉雅拉姆語、馬拉地語、尼泊爾語、旁遮普語、泰米爾語和泰盧固語。

本次更新後,「Google 翻譯」的相機翻譯功能將支持 50 種語言,iOS 和 Android 系統的用戶都可以獲得更新。

「Google 翻譯」背後最大的功臣就是機器學習。相機翻譯中就有兩個步驟需要應用人工智能。

首先,在相機對準需要翻譯的文字後,Google 翻譯會使用光學字元識別技術,對影像上的字母和字元進行識別。光學字元識別技術是一種將影像上的字母轉換為數據的機器學習系統。

隨後,神經網絡機器翻譯系統將識別到的文本,翻譯成目標語言自然發音的詞句。光學字元識別技術和神經網絡機器翻譯系統,兩個都是 Google 在人工智能領域的拿手好菜。

2017 年 3 月底,最新版的 「Google 翻譯」終於在中國大陸可用,然而其實從 2016 年 9 月開始,Google 翻譯的中英互譯就正式啟用了神經網絡機器翻譯技術。

今年 6 月 Google 宣布,在 iOS 以及 Android 的「 Google 翻譯」上加入離線神經網絡機器翻譯(NMT,Neural Machine Translation),也就是說,下載了離線的資源包後,在沒有網絡的情況下,Google 翻譯不會逐個詞語地生硬翻譯,而是逐漸學習去說人話。

我們還曾讓 Google 翻譯分別在聯網、離線沒有 NMT、離線擁有 NMT 的三種情況,對古詩詞、新聞報導、經典台詞以及日常用語,進行了多個回合的翻譯能力對比。

▲ 從左往右分別是:聯網,離線未更新 NMT,離線使用 NMT

比如翻譯 6 月 14 日新華社文章《5 月份主要數據反映中國經濟運行穩健》的第一段:「國家統計局 14 日發布的數據顯示,5 月份,國民經濟繼續保持總體平穩、穩中向好發展態勢,生產需求基本平穩,就業持續向好。」

聯網時的翻譯是:基本沒有語法錯誤。

沒有更新 NMT 前的離線翻譯是:逐字翻譯無疑,「14 日」翻譯有誤,語法錯誤明顯。

更新 NMT 後的離線翻譯是:「五月份」這個翻譯有誤,離線情況下也有使用句子的方式來翻譯。

得出結論:聯網的 Google 翻譯準確度依然是比較高的;離線情況下,就算加入了 NMT 解決了逐字翻譯的問題,用句子的方式來表達,但依然距離信達雅還有一定的距離。

目前而言,同傳翻譯員的飯碗還是很穩的。加入人工智能技術多年的「Google 翻譯」,不知道它的翻譯能力,會不會遵守摩爾定律呢?

沈星佑

太陽底下全是新鮮事

郵箱3

#歡迎關注愛範兒官方微信公眾號:愛範兒(微信號:ifanr),更多精彩內容第一時間為您奉上。

愛範兒|原文鏈接·查看評論·新浪微博

獲得更多的PTT最新消息
按讚加入粉絲團