每日最新頭條.有趣資訊

騰訊優圖發布AI手語翻譯機,有望實現聽障人士無障礙溝通

騰訊科技訊 5月16日,全球無障礙宣傳日之際,騰訊優圖實驗室宣布攻克AI手語識別技術挑戰,聯合深圳市信息無障礙研究會發布“優圖AI手語翻譯機”,致力於通過人工智能技術為聽障人群搭建無障礙溝通平台。

據優圖實驗室AI手語識別項目組研究員陽趙陽介紹,優圖AI手語翻譯機以普通攝影頭作為手語采集裝置,依托高性能計算機進行後台運算,用戶只需面對攝影頭完成手語表達,翻譯機螢幕界面就能快速把手語轉換為文字,幫助聽障人士和健聽人士進行正常交流,未來有望在機場、高鐵、民政窗口等公共場所部署應用,助力信息無障礙城市建設。

這也是繼本月初優圖實驗室宣布通過人工智能技術幫助警方尋回多名被拐超過10年兒童之後,騰訊踐行“科技向善”理念的又一體現,也是騰訊在計算機視覺人工智能領域的又一重大技術突破。

攻克手語識別難題,自研算法解決溝通障礙

據世界衛生組織最新數據顯示,目前全球約有4.66億人患有殘疾性聽力損失,超過全世界人口的5%;據估計,到2050年這一數字將達到9億,全球將有約十分之一的人出現殘疾性聽力損失。據北京聽力協會2017年預估數據,我國聽力障礙人士已達7200萬,其中有2700萬聽障者需通過手語等方式進行溝通交流。

雖然我國在信息無障礙領域的投入在逐漸增加,但聽障人群的一些需求仍得不到滿足,尤其在公共環境設施、服務體驗等方面。據相關數據統計,我國目前致力於聽障者專業服務的人士只有大約一萬名,大部分公共服務並沒有配備專門的便利設施,這些都是聽障者長久以來面臨的迫切需求。

針對這一社會痛點,優圖團隊首次將計算機視覺人工智能技術應用到手語識別場景,而此次發布的“優圖AI手語翻譯機”產品,利用了普通攝影頭和高性能計算機,可以識別聽障人士的手語,並快速識別翻譯成文字。

據騰訊優圖研究員陽趙陽介紹,手語翻譯的核心技術是手語識別(SLR),通過計算機算法,自動區分手語表達中的各類手勢、動作、手勢和動作之間的切換,最後將手語翻譯成為文字。此前也有一些團隊探索過用人工智能技術緩解聽障人士溝通障礙,但往往需要借助一些額外的設備或傳感器,不僅增加了使用門檻,而且也無法保證對複雜手語表達的識別率。不僅如此,手語特有的地域性、複雜性和多樣性,使得手語識別技術即使在深度學習的幫助下也依然存在很大的挑戰,難以被實際應用。

此次優圖AI手語翻譯機產品,通過自研算法實現了對複雜手語表達的識別技術突破,該算法參考了先進的手勢識別、動作識別和序列翻譯等技術,考慮了手語的地域性和多樣性表達,包含了不同的表達習慣和速度。

據介紹,優圖實驗室手語識別數據集覆蓋了近千句日常表達,900個常用詞匯,是最大的中文手語識別數據集。與此同時,優圖對數據進行了進一步的分析和歸納,使優圖AI手語翻譯機能夠實現整句的識別和翻譯,用戶表達的時候可以連貫將整個句子表達完,不需要設定特定的結束或起始動作,也無需在句中故意停頓或放慢速度。

踐行科技向善,騰訊攜手信息無障礙研究會攻堅場景服務

“優圖團隊將繼續進行語料庫拓展和算法優化,進一步探索在機場、民政等公共服務領域部署,提供無障礙溝通解決方案,方便聽障人日常交流提供便利。”騰訊傑出科學家賈佳亞教授表示。

為進一步深入接觸聽障群體,了解手語和優化數據和識別算法,目前騰訊優圖實驗室已和深圳市信息無障礙研究會成立AI手語識別聯合項目組,雙方將基於手語數據采集、產品算法優化等展開長期深度的合作,通過與聽障者或手語使用者進一步接觸,擴充數據容量,完善數據規範,致力於推動後續的產品和服務部署。

深圳市信息無障礙研究會秘書長楊驊表示,騰訊優圖提供的這項技術,可以在一定程度上緩解聽障者的溝通障礙,為聽障者提供更好的服務。

實際上, 這並不是騰訊在AI+無障礙建設上的首次嘗試,騰訊一直在堅持推動“一個都不能少”和“信息無障礙”理念的傳播與落地。從2009年起,騰訊在信息無障礙方面率展開探索,截至目前,旗下QQ、QQ空間、微信、騰訊網、騰訊新聞、應用寶、企鵝FM等大部分產品已針對障礙用戶實現專門優化。騰訊旗下各類產品從社交、娛樂、新聞等多維度出發,共同努力,為障礙人士構建友好的信息社會。2018年12月3日,獲得“聯合國教科文組織數字技術增強殘疾人權能獎”。

根據世界衛生組織的調查,全世界有超過十億人生活在因殘障引起的不便中,也就是說,地球上每七個人中就約有一人需要無障礙設施的幫助。為了讓更多的人關注障礙群體,了解無障礙理念,每年五月的第三個星期四也被設立為了全球無障礙宣傳日。

獲得更多的PTT最新消息
按讚加入粉絲團