每日最新頭條.有趣資訊

一線 | 曠視與Bellus3D合作 開啟3D視覺方案整合

騰訊《一線》卜祥

同時成為OPPO、vivo 手機人臉解鎖3D方案提供商之後,曠視科技對這一塊味口大增,擬以算法為撬動杠杆,整合“變硬”,提供更全面的3D視覺解決方案,在行業中謀求更大話語權和訂單量。其中一項動作是,今年年初,曠視科技已經與矽谷公司Bellus 3D接觸、合作。

曠視科技高級副總裁吳文昊告訴《一線》,“不光是手機廠商此類需求被蘋果標杆帶動,整個行業好像火山爆發之前開始冒泡泡。”一個簡單計算方法,一年出貨10億台安卓手機,第一年搭載3D人臉解鎖方案的會達到千萬部,第二年達到1億,第三年達到3億或更多。這還僅僅是手機行業的市場容量。

曠視拿到OPPO重量級產品Find X訂單之後,處在一個有利位置上。據OPPO官方宣布,O-Face 3D結構光人臉解鎖技術,通過結構光元器件在面部投射出15,000個識別點,即使是距離60cm遠,精度也能控制在±1mm範圍,給用戶的面部構建一個精細完整的3D模型,誤識率僅百萬分之一(指紋識別誤識率為五萬分之一),安全性是指紋識別的20倍。

不僅僅是OPPO的結構光,還有vivo的TOF技術。在進入了vivo X20、X21機型,提供突破 2D 的人臉和影像識別技術商業化通用後,曠視科技助力vivo的TOF技術也於6月底在上海亮相。

6月27日,vivo 在2018 MWC 上海發布了 TOF 3D 超感應技術。在現場,用戶只需要站上 vivo 的體驗機,搖臂上搭載了 TOF 3D 超感應技術的原型機就會對用戶的頭部進行環形掃描,錄入之後15秒就會形成一個高精度的 3D 人臉模型,輪廓和細節的把控都十分清晰,用戶還可以拖動模型查看任一角度的自己。這裡用到曠視科技提供的3D 視覺感知技術。

據曠視科技介紹,曠視已經做成自研 3D 算法模型結構。其中識別方案,是在曠視自有的算法模型配合十億級人臉數據的訓練和數近百萬張 benchmark 測試後得出的結果,可以使曠視的3D方案在應用上的計算耗時更短、安全性更高,在一些性能的關鍵點上甚至優於iPhone X ,可實現0.1秒內極速識別、0.03秒重建和達百萬分之一的人臉支付精度。

另外,還有3D 解鎖與支付、3D 人像光效和3D 美顏與整形等。

在吳文昊看來,這些還遠不夠。曠視科技在這一塊目標是進行軟硬一體的垂直整合,可以提供整體視覺解決方案——一個模組解決方案。“模組誰生產不重要,手機廠商來指定就好了。”吳文昊說,“現在沒有人有能力把軟硬一體很好地整合在一起,是缺位的。”

具體思路上,與市場上一些從硬體往算法(從下往上)的整合方案不同,吳文昊和團隊想嘗試一種從上往下整合方案。

Bellus3D 是曠視深度合作的戰略夥伴。團隊與曠視頗有淵源。Bellus3D CEO Eirc Chen是台灣人,早在20年前即在蘋果公司做VR項目負責人,屬業界老人。他的下屬之一是後來去微軟的沈向洋。再後來,“沈向洋是孫劍的老闆,孫劍是我們首席科學家,然後孫劍是印奇(曠視創始人)的導師。”吳文昊介紹。

曠視另一個合作團隊是香港科技大學權龍教授。權龍教授的研究範疇包括人工智能、電腦視覺、三維重建、影像分析、識別與理解等。另外,曠視還與上海科技大學一個團隊合作。

3D領域不論是結構光,還是TOF,整個產業鏈挺長,是一個全新領域。從技術角度而言,涉及到四個層面。從下往上,最下面(第一層)跟硬體強相關,含光學、傳感器、芯片。僅芯片就包括主芯片,ISP和一些整體架構等,這是所有跟硬體相關的層面,包括結構光、TOF和雙目等。模組硬體涉及到設計、生產和製造。

第二層是韌體,是和第一層硬體強吻合的地方。舉一個例子,現在雙攝影頭很流行,兩個攝影頭之間怎麽協同工作,怎麽樣去做虛化,做美顏,兩個攝影頭之間怎麽對準,怎麽標定等,在這一層。

第三層與電腦視覺強相關,是曠視強項。可以分為兩個大類,一個是識別,一個是重建。識別其實是感知,理解鏡頭所所看到的東西。手機上FaceID人臉解鎖輕輕一瞥,涉及到人臉檢測、跟蹤、注意力檢測、活體比對等等。另外一塊是3D重建,3D重建基礎是幾何,是深度學習。3D美顏,3D整形,3D塑性,3D試裝等,是這項技術延展性應用。

最上面第四層是應用層。應用在手機上面一個基礎應用是人臉解鎖,以後還會有AR遊戲、虛擬試穿等等多項應用。

在這樣一個關鍵節點上,曠視接下來想從第三層進入第二層。

獲得更多的PTT最新消息
按讚加入粉絲團