每日最新頭條.有趣資訊

清華馬少平教授:搜狗翻譯寶Pro強在大數據

9月19日,搜狗正式對外發布新的智能翻譯硬體——搜狗翻譯寶Pro。多場景的翻譯測試數據顯示,搜狗翻譯寶Pro的準確度評分遠超世面主流翻譯產品。中國人工智能學會副理事長、清華大學馬少平教授對此表示,“大數據語料”是決定智能翻譯“聽懂、看懂、說清”的關鍵,而這正是搜狗翻譯寶Pro的優勢所在。

另據了解,搜狗翻譯寶Pro離線翻譯支持中英日韓4種語言互譯,在線翻譯可支持法語、阿拉伯語、德語、意大利語、西班牙語等42種語言互譯,覆蓋200多個國家。同時,搜狗翻譯寶Pro還加入了實景拍照翻譯功能,能幫助用戶準確識別點餐、問路等各種場景下的文字資訊。尤為值得一提的是,搜狗翻譯寶Pro離線翻譯與雲端翻譯結果基本無差異。這也是其區別於市面上其他競品的又一亮點。

當前,隨著通信技術的不斷發展,語言對溝通產生的阻礙越發明顯,包括谷歌、微軟、Facebook、搜狗、騰訊等各大科技公司都在發力智能翻譯技術,市場上的翻譯機產品也如雨後春筍一般湧現。但這些翻譯軟體、翻譯機的實際效果卻並不盡如人意。此前曾有評測報告顯示,這些翻譯APP和“翻譯機”將外語翻譯成中文時的準確率非常低。

馬少平認為,智能翻譯必須以大數據語料做支持。如果機器翻譯缺乏大數據支持,就只能按照既定的語法規則將詞匯組織起來,無法領會語言的自然性和多義性。這種情況下,翻譯出的結果通常不符合語言的習慣表達方式,基本不能直接使用。

數據顯示,搜狗每天語音請求次數在3 億次,每天可以收回大概24萬小時的語料數據。中國人工智能學會和IEEE會員、北京郵電大學電腦學院教授石川對此也表示,任何一項人工智技術的發展都離不開大數據。智能翻譯領域也不例外,得語料者才能得天下。搜狗在此方面的優勢保證了搜狗翻譯寶Pro能在眾多智能翻譯硬體中脫穎而出。

大數據語料之外,強大的人工智能技術加持是搜狗翻譯寶Pro能夠在眾多競品中脫穎而出的又一原因。作為中國知名的互聯網企業,搜狗多年來一直在人工智能領域展開投入,並完成了全球獨創的神經網絡機器翻譯技術。該技術曾在國際學術賽事WMT2017中獲得中英機器翻譯全球第一。

此次,搜狗翻譯寶Pro就採用了該技術,並以深度循環神經網絡編碼解碼框架技術作為主要技術,使用完全端到端的學習方式。獨特的人工智能技術和大數據語料的融合,不僅保證了搜狗翻譯寶Pro離線和在線翻譯的準確度,真正解決了用戶聽不懂、看不懂、說不出的問題,也保證了整個翻譯決策過程的連續性,使得翻譯出的句子在流暢度上更優異。

專家們表示,2018年以來,中外各大互聯網企業都在紛紛布局智能翻譯市場。搜狗翻譯寶Pro的推出標誌著智能翻譯正式進入“智能”賽道。而智能翻譯硬體有可能成為AI消費硬體的第一枚果實。

獲得更多的PTT最新消息
按讚加入粉絲團