登陸成功率99％雲知聲攜手平安好醫生推聲紋登錄系統

公開日: 2019-01-21

中新網1月21日電日前，語音 AI 領軍企業雲知聲宣布，其與中國領先的一站式醫療健康生態平台平安好醫生(01833.HK)共同研發的“聲紋登錄系統”(又稱聲紋鎖)經過多次模型優化和更新迭代後，登錄成功率接近 99%，達行業一流水準。

聲紋識別(Voiceprint Recognition，VPR)也稱說話人識別，是一種通過聲音判別說話人身份的技術，分為說話人辨識和說話人確認。前者用以判斷某段語音是若乾人中的哪一個所說的，即“ N 選一”；後者用以確認某段語音是否是指定的某人所說，是“1對1匹配”問題。不同的任務和應用會使用不同的聲紋識別技術，如縮小刑偵範圍時可能需要辨認技術，而銀行交易時則需用到確認技術。

雲知聲聲紋技術負責人表示，作為國內為數不多具備全棧語音技術能力的人工智能公司，雲知聲已在聲紋技術領域深耕多年。團隊多位技術骨乾曾在美國國家標準技術署(NIST)主辦的說話人識別技術評測中多次屢次斬獲第一名，且早在 2004 年，尚就職於摩托羅拉公司的雲知聲公司創始人黃偉博士便帶領團隊研發出世界上第一款手機聲紋認證系統，搭載該系統的相關產品總計銷量超 2 億台。

近年來，伴隨深度學習的興起，雲知聲在國內率先將這一技術使用到語音識別中，且後續引入到聲紋識別領域，解決了一系列聲紋技術實用難點，並應用到實際產品上。此次，雲知聲和平安好醫生聯手打造的平安好醫生客戶端用戶聲紋登錄系統便是其中一項成功案例。

雲知聲聲紋技術負責人指出，雖然聲紋識別優勢明顯，但是要想準確分辨聲音特徵卻並非易事。首先，聲紋識別系統性能會受用戶發聲狀態影響，如用戶的身體狀況、情緒等都會影響識別準確度。其次，環境的嘈雜度，以及采集、傳輸音頻的硬體配置，都會在不同程度上對識別系統造成干擾。

為解決上述難點，雲知聲聲紋技術團隊進行了一系列技術攻堅與創新。首先，依托雲知聲強大的語音信號前端處理技術，如 VAD、語音降噪等，準確地捕捉到人聲並進行背景噪聲消除；其次，雲知聲將 DNN 引入到傳統聲紋識別 ivector 技術框架中，並融合最新端到端聲紋識別技術，基於雲知聲超算平台和海量聲紋訓練數據，使得模型得以學習到數萬說話人，每人多種發聲的特性，且在雲端針對每個用戶採用說話人自適應技術，達到越用越好的效果；在信道處理上，採用 PLDA 信道補償技術，可將信道影響降到最小。

據悉，為保障用戶登陸的“安全性”，雲知聲為平安好醫生客戶端聲紋登錄系統提供數字串注冊和登錄的“文本弱相關”技術，工程難度更高，安全性更強。與傳統固定口令登錄方式不同，該系統採用隨機數字串登錄方式，即在用戶進行登錄時，系統會隨機下發 8 位隨機數字串，可有效規避錄音攻擊等安全問題。

在同一账號下，雲知聲聲紋識別產品可支持 6 人注冊。在客戶端，雲知聲提供封裝好的 SDK，支持聲紋注冊、登錄、解綁等接口，供上層調用 API 實現產品邏輯。同時，雲知聲還提供成熟的聲紋服務私有化部署方案，基於在金融、客服、快遞等不同行業豐富的私有雲部署經驗，可有效保障客戶數據安全。

公開資訊顯示，在移動醫療領域，雲知聲與平安好醫生有長期合作。2017 年 12 月，雙方合資成立上海澔醫智能科技有限公司，共同探索以智能語音識別等技術為基礎的家庭智慧醫療服務終端建設。

登陸成功率99％ 雲知聲攜手平安好醫生推聲紋登錄系統

登陸成功率99％雲知聲攜手平安好醫生推聲紋登錄系統