每日最新頭條.有趣資訊

騰訊發布人工智能輔助翻譯 致敬人工翻譯

11月13日,深圳 - 騰訊AI Lab今日發布了一款AI輔助翻譯產品 - “騰訊輔助翻譯”(Transmart),可滿足用戶快速翻譯的需求,用AI輔助人工翻譯提高效率和品質。該產品採用業內領先的人機互動式機器翻譯技術,融合神經網絡機器翻譯、統計機器翻譯、輸入法、語義理解、數據挖掘等多項前沿技術,配合億級雙語平行數據,為用戶提供實時智能翻譯輔助,幫助用戶更好更快地完成翻譯任務。產品旨在致敬人工翻譯,輔助人工翻譯更快、更好地完成任務,探索人工智能賦能翻譯行業新思路。

“騰訊輔助翻譯”目前專注於中英互譯功能,這佔國內翻譯業務80%以上,希望將中英互譯的用戶體驗極致化。目前產品全面開放,普通用戶可登錄網頁,翻譯行業合作夥伴可直接調用多個應用程式接口,包括互動式機器翻譯、輔助翻譯輸入法、個性化機器翻譯、定製化機器翻譯等。產品同時提供私有化部署,可將全套系統安裝到用戶本地網絡,保證業務數據安全。

近年來,隨著神經網絡機器翻譯技術的快速發展,機器翻譯譯文品質不斷提升,機器翻譯取代人工翻譯的論調也甚囂塵上。騰訊輔助翻譯團隊認為,在實際操作中,現階段的機器翻譯譯文經常錯漏百出,在完全沒有人工乾預的情況下,機器翻譯譯文的準確率並不能達到具體應用領域的翻譯要求,如商業合約、法律條文、專業書籍、學術文獻、旅遊文本等。一名合格的職業翻譯不僅需要長期的專業刻苦訓練,還要具備大量的實戰經驗,才有可能勝任具體專業領域的翻譯工作。在實際的應用場景下,目前機器翻譯譯文的準確率還無法與專業人工翻譯匹敵。

但是,因為計算能力增強、機器翻譯模型創新、語料規模大幅提升,機器翻譯譯文品質較之前已有明顯改善,翻譯速度也遠勝人工翻譯。現階段,機器翻譯可提供譯文參考,幫助人工翻譯完成一部分相對機械的任務,讓人工翻譯從繁雜低效的打字、查詞等體力勞動中解脫出來,將精力投入到更高層次的譯文創作中。在機器翻譯等人工智能技術輔助人工翻譯過程中,人工翻譯將獲得個性化機器翻譯結果。通過人工與機器之間的互動,進一步提升翻譯效率和品質。機器翻譯不能替代人工翻譯,但將重構人工翻譯過程,騰訊輔助翻譯正是基於這種理念而開發出來的技術創新產品,旨在提升人工翻譯效率和翻譯品質,滿足日益增長的翻譯需求。

騰訊輔助翻譯產品採用了團隊自研的人機互動式機器翻譯技術,是一款人工智能輔助翻譯互聯網落地產品。人機互動式機器翻譯技術專門針對人工翻譯過程,是人工智能輔助翻譯系統的核心技術。與一般的機器翻譯相比,人機互動式機器翻譯的重要特徵是允許用戶實時乾預譯文生成,提供互動式機器翻譯、翻譯輸入法、實時譯文建議等高效互動手段以提高人工翻譯效率。騰訊輔助翻譯實現了兩個“第一”:

1、內核是國內第一個公開的互動式機器翻譯的互聯網落地產品;

2、搭載了業內第一個公開的融合機器翻譯的輔助翻譯輸入法。該產品融合了人工智能和傳統輔助翻譯技術,為用戶提供更便捷、流暢的人工翻譯體驗。

騰訊輔助翻譯具體功能亮點如下:

互動式機器翻譯

首個公開的互動式機器翻譯互聯網落地產品,根據輸入內容實時更新自動譯文,顯著提升翻譯效率。

互動式機器翻譯基於自主實現的約束翻譯解碼技術,在提升譯文準確性的同時,解碼速度也被優化到滿足互聯網環境中實時互動的要求。實時解碼速度是影響互動式機器翻譯產品落地的關鍵因素。結合已有積累,騰訊AI Lab設計並實現了專用於人機互動的神經機器翻譯系統。與普通機器翻譯不同,互動式機器翻譯的挑戰主要在於無法預測用戶動作,從而難以通過對原文建立緩存等常規方法來加快響應速度。騰訊AI Lab不斷攻克技術難關,並一直致力於創造用戶體驗更佳的互動式機器翻譯產品。

輔助翻譯輸入法

首個融合機器翻譯的輔助翻譯輸入法產品,比普通輸入法更少的按鍵數,顯著減少打字時間。更快捷的拚音轉漢字、更準確的單詞補全,讓用戶享受翻譯過程。

普通輸入法因為難以感知翻譯場景中的上下文資訊,在準確性和個性化方面還有較大的提升太空。與普通輸入法相比,輔助翻譯輸入法可利用統計機器翻譯和神經網絡機器翻譯的知識,極大提升自動組詞和推薦短語的準確性,同時使輸入預測更具個性化。

自主實現的輸入法知識挖掘算法,持續從海量互聯網數據、億級雙語句對中抽取片斷翻譯知識,以此作為輔助翻譯輸入法的基礎。在翻譯過程中,再實時融合當前句子的機器翻譯上下文資訊,輔助用戶快速完成翻譯任務。

比如翻譯英文句子“Jane Zhang became the first Chinese singer to perform for Victoria's Secret, joining the ranks of Taylor Swift and Katy Perry.”時,自動機器翻譯錯誤地把張靚穎的英文名“Jane Zhang”翻譯成了“簡·張”:

當用QQ拚音輸入法時,需要輸入“zhangliangy”共11個字母才能得到正確的“張靚穎”。

但是,採用輔助翻譯輸入法之後,因為有數據挖掘和機器翻譯知識的支撐,只需要輸入“zl”就可以得到期望的結果。

由此可見,輔助翻譯輸入法能夠通過減少打字敲鍵數,提升人工翻譯效率。

實時譯文建議

基於自研的神經網絡機器翻譯引擎,提供靈活、準確的實時譯文片斷智能推薦,並可根據用戶翻譯歷史和習慣不斷學習,提供更貼合用戶期待的個性化譯文建議。

因目前階段的機器翻譯技術所限,機器譯文的準確率並不高,因此提供的實時譯文建議不能太長,否則會降低人工翻譯效率。實時譯文建議的難題就在於如何提供長度適中、準確率也比較高的短語或者子句。為此,騰訊 AI Lab 提出並實現了譯文智能推薦算法,綜合統計機器翻譯、神經機器翻譯等技術,盡量為用戶提供最合適的譯文建議。

比如,在翻譯句子“首屆中國國際進口博覽會即將於11月5日開幕。”時,智能推薦算法發現機器譯文將“開幕”一詞翻譯為“open”,但是在相對正式的文本中,翻譯為“...be held”更恰當。智能推薦預測用戶可能會在此處進行修改,就縮短了推薦片段,隻推薦“...will”,方便用戶直接採用。

千萬級專業術語、億級例句參照

與傳統輔助翻譯軟體相比,智能譯文建議的來源不再局限於用戶導入的術語庫,而是全面綜合互聯網海量數據。騰訊AI Lab從幾百TB的互聯網文本中挖掘了數千萬的專業術語翻譯和億級雙語例句提供給用戶作為翻譯參考資訊。然後以句子為維度關聯展示術語庫、例句庫等參考資訊,滿足用戶多領域、多文體的翻譯需求。

輔助翻譯API與定製化服務

為合作夥伴開放互動式機器翻譯、輔助翻譯輸入法、個性化機器翻譯API、定製化機器翻譯等多個應用程式接口,提供定製化服務。

騰訊輔助翻譯由騰訊AI Lab的內部團隊歷時一年完成。騰訊AI Lab是騰訊的企業級AI實驗室,於2016年4月成立,目前在中國和美國有70位頂尖研究科學家及300位應用工程師。自然語言處理(Natural Language Processing,簡稱NLP)是四大主要研究領域之一。NLP團隊致力於追蹤和研究最前沿的自然語言文本理解和生成技術,並孵化下一代自然語言處理技術與商業應用場景。團隊科學家已在前沿理論研究上取得諸多創造性成果,在應用探索方面,其文本理解、文本生成、對話和機器翻譯等技術已應用於公司諸多產品,提升產品智能化以更好服務用戶。

體驗網址:http://transmart.qq.com;郵件問詢:[email protected]

獲得更多的PTT最新消息
按讚加入粉絲團