每日最新頭條.有趣資訊

“地平線”之上

圖靈獎,常被稱作“計算機界的諾貝爾獎”,該獎項今年第一次頒給AI深度學習領域,而獲獎者正是深度學習三巨頭:Yoshua Bengio、Geoffrey Hinton、Yann LeCun。

55歲的Yann LeCun是三人之中最年輕的一位,也是神經網絡之父GeoffreyHinton曾經的學生。早在80年代,LeCun開發了卷積神經網絡,成為神經網絡領域的基本模型。如今,卷積神經網絡是計算機視覺、語音識別、語音合成、圖像合成和自然語言處理領域的行業標準。

LeCun本人與中國的淵源頗深,不僅名字像中國人,還自稱有中國血統,並以楊立昆為其中文名。LeCun近年來常到中國進行人工智能的交流,曾對一位中國科學家大加讚賞,稱他為“探索深度學習的先驅之一”(A pioneer in the deployment of deep learning)。

而在LeCun教授口中的pioneer(先驅),正是目前地平線機器人的創始人&CEO余凱博士。

不多的頭髮加上黑框眼鏡,余凱有著中國博士的典型形象。2004年在慕尼黑大學獲得計算機科學博士學位,曾在微軟亞洲研究院實習,畢業後加入西門子神經計算部門,2006年來到矽谷加入美國NEC Labs做深度學習的研究,這個實驗室曾是LeCun工作過的地方。

在NEC Labs期間,余凱擔任部門主管(Department Head),領導團隊在深度學習、圖像識別、文本挖掘,多媒體檢索、視頻監控,以及人機互動等方面的產品技術研發。正是在這段時期,余凱結識了不少日後人生中重要的良師益友,包括吳恩達、徐偉、黃暢等人。

余凱在計算機視覺和圖像識別方面有突出學術貢獻,多篇學術論文在CVPR、IEEE等國際頂尖學術平台上發表,他在人工智能領域發表的研究論文被全球同行廣泛引用超過14000次。2010年,帶領團隊在首屆ImageNet大規模視覺識別競賽中獲得第一名。

Yann LeCun在2014年的一次訪談中評價到,“最近五年裡余凱領導的NEC加州實驗室是世界上最活躍的五家早期開展深度學習卷積神經網絡的研究團隊之一。”

從百度到地平線

雖然余凱從事深度學習研究已有多年,但是直到2012年深度學習才開始走向實際應用。包括Google、Facebook在內的巨頭廣泛布局人工智能,科學家們從幕後走到台前,Hinton選擇加入Google,而他的學生LeCun接受了Facebook的邀請。

2012年在獵頭的極力推薦下,李彥宏找到了余凱。與李彥宏聊了半小時以後,余凱決定回國加入百度。對於選擇百度的理由,余凱日後表示:“到今天為止,百度是中國最有技術基因的一個公司。面臨移動互聯網的轉型,對技術的逾加重視,是百度從上到下的戰略決策。”

余凱加入百度,對其個人而言,是第一次從實驗室走向商業化,後來的地平線機器人能夠在商業上迅速落地,余凱的這段經歷幫助很大。

余凱在2012年4月加入百度後,先是領導新成立的百度多媒體部,負責百度在語音、圖像、音頻等領域面向互聯網和移動應用的技術研發。這一年,百度開始大規模採購和建立GPU運算集群。開發了世界上第一個支持GPU&CPU的並行深度學習平台。

而余凱還有更艱巨的任務——組建一個深度學習研究院,從2012年開始就在全球各地網羅深度學習領域的人才。

一年時間,余凱為百度組建了一支強大的深度學習團隊,徐偉、吳韌、張潼、黃暢、倪凱等大牛陸續加盟,這些人在加入百度之前,都在微軟、雅虎、Facebook、AMD、NECLabs等科技企業或實驗室長期從事人工智能的研究。

2013年7月,百度深度學習研究院(Institute of DeepLearning,IDL)成立,李彥宏親自任院長,余凱任常務副院長,主要進行深度學習、機器人、自動駕駛、人機互動、3D視覺、圖像識別、自然語言理解等方面的研究。

2014年5月,在余凱的影響下,吳恩達正式加入百度擔任首席科學家。彼時吳恩達已是享譽全球的人工智能科學家,與LeCun、Hinton、Bengio並稱為“四大金剛”。而此前余凱曾在百度內部提議收購Hinton團隊,但天不遂人願,Hinton選擇了Google。

網羅人才,這是余凱做為百度做的第一件事,而第二件事是,在2013年發起了國內第一個自動駕駛項目,成為百度目前最大的標簽之一,百度Apollo平台正是源自於此。

在百度的三年時間,余凱將深度學習應用於語音識別和圖像識別、檢索,以及廣告CTR預估,其中圖片檢索達到了國際領先水準。率領團隊開發了世界上第一個基於深度學習的在線廣告系統和搜索排序系統,部署了當時世界上規模最大的基於FPGA的深度學習加速器。

但是到了2015年,經過深思熟慮的余凱開始選擇自主創業,而在他提出辭職的那一刻,已經想好了要做什麽。“星辰大海,自我清零,從此專注一件事。”這是余凱當時立的一個Flag。

後來余凱解釋這次決定,回答了三點:一是我帶領百度的人工智能已經發展到在國內國際都相當領先,我也說服了吳恩達加入百度,我覺得我的使命已經告一段落;二是我認為人工智能往前去發展,一定要走軟硬結合的道路;三是我判斷在未來的十年裡,創新的機會將一波一波越來越大,我要到新的時代裡去中流擊水,而不是隻做一個監視者。

所謂軟硬結合,就是做算法的同時再做芯片,事實上在軟體領域浸淫十幾年的余凱,早就有從軟體的框架中跳出來做芯片的想法,之前在百度做自動駕駛的軟體,需要搭載NVIDIA的GPU或英特爾的FPGA才能應用於終端。

但是余凱認為自動駕駛領域更需要專用芯片,而不是通用芯片,所以從2015年出發的時候就說,地平線不只是一個算法公司,還要做專用的人工智能處理器,做軟硬結合的嵌入式人工智能。

邊緣計算領域的Intel

2015年7月,余凱創辦地平線機器人公司並擔任CEO,這裡的“機器人”不是一般中文說的“機器人”,而是涵蓋意義更廣泛的英文“Robotics”的自動化系統,比如一輛智能汽車。

地平線的名字更具深意,其英文horizon原意並非是地平線,而是“物理可測量最遠的邊界”。宇宙大爆炸發生距今有140億年,宇宙是以光速膨脹的,到宇宙的邊界也就是是140億光年的距離。余凱想的,就是走到足夠遠,一起去穿越這140億光年。

余凱曾在一次採訪自嘲到,以前頂著百度IDL院長的光環,走到哪裡都是人人圍著自己轉,可一旦創業後,突然發現自己誰都不是,還要苦惱發不出員工的工資。

但是從余凱決定自主創業的那天起,投資機構就已經擠破了頭。在離開百度後不到兩個月,就完成了數百萬美元的天使輪融資,投資機構多達7家,而且都是晨興資本、紅杉中國這樣的頭部機構。

徐小平的真格基金也只是分了一點湯,“地平線在估值6000萬美元的時候,我擠進去了一點點份額。我問余凱,你融資的時候有沒有想到我?他說他想到我了,但當時他身邊有很多其他投資人盯著。

而讓投資機構擠破頭的,就是余凱的一句話。他對投資人說,地平線要做基於“算法+芯片”的嵌入式人工智能解決方案,“要做就做市場上沒人能做的事。”在全世界的AI公司中,很少有一家公司既做技術又做芯片。

成立地平線機器人,余凱還帶走了百度的黃暢、徐偉、余軼男等人,分別擔任聯合創始人&算法副總裁,AI首席科學家,智能駕駛研發總監。

黃暢長期從事計算機視覺、機器學習、模式識別和信息檢索方面的核心算法研發。早在2004年,黃暢的人臉檢測算法突破性實現在芯片中,現已佔領80%的數位相機市場。從NEC到百度再到地平線,黃暢一直都是余凱的左膀右臂。

後來余凱又分別找到楊銘、吳強、周峰,楊銘擔任聯合創始人&軟體副總裁,吳強、周峰為首席雲架構師和首席芯片架構師。加上黃暢、徐偉等人,組成了地平線的核心研發團隊。

楊銘也是余凱在NEC Labs的同事,後來成為Facebook人工智能研究院創始成員之一,主導的DeepFace項目應用於世界上最大的人臉識別系統。楊銘在頂級國際會議CVPR/ICCV發表論文20余篇,在頂級國際期刊T-PAMI上發表8篇論文,被引用超過6200次。

吳強曾任Facebook總部高級主任研究員,擔任過多個項目的技術負責人和主設計師,系統化地搭建連接十幾億人的雲端架構。其論文曾獲得國際計算機協會(ACM/IEEE)第38屆計算機架構大會(MICRO-38)唯一的一個最佳論文獎。

周峰有著豐富的芯片開發經驗,曾帶領團隊研發了世界第一個用FPGA實現用於視頻會議系統的H265高清視頻編碼器,和針對視頻監控及下一代手機的H265超高清視頻編碼ASIC芯片。

同時,余凱找來了方懿擔任聯合創始人&硬體副總裁,一位擁有19年產品研發及管理工作經驗的女工程師,曾任諾基亞智能手機大中華區研發副總裁。加入地平線之後,方懿和周峰一道組建芯片設計團隊,負責芯片IP研發,與黃暢領導的算法團隊展開合作。

因此,地平線一開始就擁有了從算法、軟體到芯片的完整研發團隊,立志要做機器人時代的Intel。“Intel擁有完整的CPU、FPGA、5G通信技術以及晶圓廠的製造工藝,其它廠商都是Fabless,自己設計但不製造,但Intel從設計到製造是一體的。”

並且地平線的目標市場非常清晰,“在戰略上完全放棄手機這個方向”,專注於智能駕駛和AIoT(人工智能+物聯網)邊緣計算等領域。

邊緣計算,主要區別於雲計算。眾所周知,雲計算就是將分散在各處的海量數據傳送到雲端再進行計算,而邊緣計算更靠近數據生成的設備端,數據的收集和計算都是基於本地。地平線做邊緣計算,主要是從自動駕駛的獨特性上考慮。

自動駕駛汽車就像是一個“移動數據中心”,配備了非常多的傳感器,汽車隨時隨地都在感知周圍環境,從而源源不斷地產生數據。汽車需要將這些數據實時處理,形成汽車行駛過程的指令。如果自動駕駛系統感知到後需要把信號傳送到雲端再做決策,會相比本地運算產生更長時延,假如遇到當時網絡不穩定,後果將不可想象。

而地平線對於雲計算仍有自己的追求,“我們這些硬體都在線下的各種終端去獲取數據,我們希望在雲端匯集數據,將來可以有大數據延展出來的各種服務能力跟新的打法。”余凱說。

地平線上的“中國芯”

地平線從算法起步,2015年提出自主研發AI專用處理器架構BPU(Brain Processing Unit),並規劃了高斯、伯努利和貝葉斯的三代BPU架構。這比Google公開TPU早了將近一年。

每一代BPU架構都有對應的自動駕駛解決方案。根據地平線自動駕駛平台的規劃,雨果1.0是面向L2的技術,雨果2.0是面向限定場景下L4的技術,而雨果3.0則是完全面向L4的技術。

確定了方向,產品的研發自然水到渠成。2016年3月,地平線首次向外界展示在真車上同時實現車道線/車輛/行人檢測的ADAS(智能駕駛輔助系統)產品原型系統。同年,地平線向博世授權了一份與ADAS相關的軟體,這也是公司當年一項重要的業務。

在地平線ADAS原型系統發布後不到一個月,余凱便在朋友圈曬出他與矽谷傳奇風險投資人Yuri Milner的合影,並且拿到後者的投資(數千萬美元)。7月,獲來自雙湖投資、青雲創投和祥峰投資的重量級投資並獲得其它投資機構的追加投資。

2016年10月,余凱帶著團隊去美國拜訪了Intel的一個部門。那次之後,Intel主動提出希望和地平線合作,“因為他們很少碰到一個算法團隊對硬體理解那麽深。”

2017年1月的CES,地平線展示了與Intel合作的ADAS,“硬體由地平線的BPU架構加上英特爾的FPGA構成,在上面跑我們的軟體。當時基本全球的主流OEM(主機廠)跟Tier1(一級供應商)都被吸引來了。”此時距離與Intel確立合作關係隻過去了一個半月。

這次合作給Intel留下了深刻印象,他們很少看到一個合作夥伴能在一個半月就做出來這麽一個東西——通常來講,這個時間是兩年。Intel的全球副總裁Dan McNamara看過原型之後主動跟余凱提議“可以看看投資一下你們”。

CES結束之後,Intel請地平線在底特律的道路上利用實際路況展示ADAS的效果。Intel也請了不少美國本土的車企到場,一家車企在看過ADAS的demo之後跟地平線簽訂了合作。

2017年10月,Intel Capital領投地平線的A+輪融資,晨興資本、高瓴資本、線性資本等三家天使輪投資機構繼續跟投,合計融資超1億美元,與同期寒武紀的A輪融資旗鼓相當。

“Intel提供了一種開放的關係,不會干涉我們。我們可以在方案上用Intel的CPU,用NVIDIA的GPU,當然也可以用我們自己的芯片。”這是地平線樂於接受Intel Capital投資的原因。

這時的地平線已經“萬事俱備,只欠東風”,歷時兩年半,自家的芯片即將面世。

事實上,2016年地平線就確立了高斯架構,並先後在GPU、ARM、FPGA等多個平台上實現了基於自主IP架構的解決方案。通過賣軟體,前三年地平線收入幾千萬。

與算法不同,芯片研發需要更長時間,直到2017年12月,基於BPU架構自主研發的專用芯片成功流片,才標誌著地平線“算法+芯片”的戰略初步成功。相比於CPU、FPGA、GPU等通用處理器,地平線的AI專用處理器在特定場景上的效率要高得多。

地平線將軟硬體的設計緊密結合,高效的算法要配合專門為算法設計的芯片架構,由此做到高效率和低能耗。

在2017年12月的發布會上,地平線首款嵌入式人工智能視覺芯片——征程1.0處理器和旭日1.0處理器,面向智能駕駛和智能攝影頭,並落地智能駕駛、智慧城市、智能商業三大場景。

征程1.0處理器具備同時對行人、機動車、非機動車、車道線、交通標誌牌、紅綠燈等多類目標進行精準實時檢測與識別的處理能力,應用在智能駕駛場景中。

旭日1.0處理器則通過深度學習算法,支持在前端實現大規模人臉檢測跟蹤、視頻結構化,可應用於智能城市、智能商業等場景。

這兩款處理器具有3個主要優勢:其一是高性能,實時處理1080P@30幀,並對每幀中的200個目標進行檢測、跟蹤、識別;其二是低功耗,典型功耗在1.5W;其三是低延遲,延遲小於30毫秒。

相對於雲端處理,將AI處理器落地終端設備,經過邊緣學習的模塊,能夠促進模型不斷提升自己,將錯誤率降低50%以上。

征程和旭日兩款芯片成為中國最早實現流片量產的人工智能處理器,短短半年後可支持客戶側產品量產出貨,成為中國第一顆商業化落地的人工智能視覺處理器。

在兩款芯片的基礎上,2018年地平線又發布兩款產品——高清智能人臉識別網絡攝影機和Matrix自動駕駛計算平台。

地平線智能攝影機,搭載旭日人工智能芯片,提供基於深度學習算法的人臉抓拍、特徵抽取、人臉特徵值比對等功能。可以在攝影機端實現人臉庫最大規模為5萬的高性能人臉識別功能,可廣泛用於智慧城市、智慧零售等多種行業。

除了應用在自家的終端產品上,在AIoT領域,旭日系列處理器賦能了20多家領先的設備供應商,這也使得旭日成為2018年全年國內出貨量最大的邊緣人工智能處理器之一。

去年4月地平線發布了新一代自動駕駛處理器征程2.0架構,以及基於征程2.0處理器架構的高級別自動駕駛計算平台Matrix1.0,其主要是面向L3/L4的自動駕駛解決方案。

地平線Matrix360°視覺感知方案搭載三塊Matrix,每塊Matrix可同時接入4路720P視頻輸入,實時處理速度>50fps,每塊Matrix的功率僅為31W。

面向智能駕駛,目前地平線已形成由征程處理器、Matrix自動駕駛計算平台、ADAS、DMS、AR HUD、Face ID等構建的智能駕駛產品矩陣,地平線可針對客戶不同需求提供針對L2、L3、L4等不同級別自動駕駛的解決方案。

地平線也是中國唯一在世界四大汽車市場(美國、德國、日本和中國)與全球頂級OEMs和Tier1s建立合作夥伴關係的自動駕駛初創企業。奧迪在中國隻挑選了兩家合作夥伴,聯合開發自動駕駛技術。這兩家公司一個是百度,另一個就是地平線。

目前,地平線Matrix自動駕駛計算平台已向世界頂級L4自動駕駛廠商大規模供貨,成功開創了中國自動駕駛芯片產品出海和商業化的先河。基於Matrix與單目攝影頭的NavNet眾包高精度地圖采集與定位方案以及雷射雷達感知方案開始落地。

現在的地平線已經有了比較清晰的商業模式,余凱直言:“與通用芯片廠商不同,地平線的商業模式是往後走,成為平台,做OEM、Tier1的供應商,集成商和行業解決方案商背後的賦能者。”

余凱在去年10月的安博會上透露,2018年地平線收入已達到億元級,比上年增長近10倍,2019年將邁入大規模商業化。不過中肯地說,地平線離整體盈利還有不小的距離。

對此,余凱也比較淡然。“如果我們已經盈利了的話,那這個企業就沒有未來。這說明你把自己掙的錢,完全沒有投資到未來,你只是在做現有的事情,目光非常短淺。創業公司沒有這麽做的。”地平線先後設立了北京、深圳、上海、南京四個研發中心,研發投入不菲。

今年地平線的“彈藥庫”再次得到補充,2月底,地平線官方宣傳獲得6億美元B輪投資,估值達30億美金,超越寒武紀成為全球估值最高AI芯片獨角獸,融資金額打破AI芯片創業公司融資紀錄。

本輪融資由SK中國、SK Hynix以及數家中國一線汽車集團(與旗下基金)聯合領投,其他機構與戰略合作夥伴包括:中國泛海控股集團旗下泛海投資、民銀資本、中信裡昂旗下CSOBOR基金和海松資本等。

同時,地平線還創造了一個記錄:拿下全球三大半導體企業中的兩家融資(Intel和Hynix),這在AI芯片創企中絕無僅有。

與寒武紀、商湯的比較

到目前為止,我們已經全面介紹了三家人工智能公司,說到地平線,就難免與寒武紀和商湯進行比較,總的來說,這三家公司都是中國人工智能領域的佼佼者,只是側重點各有不同。

其中,商湯科技更加注重算法,而且是底層算法,搭建亞洲規模最大的AI超算平台,但是芯片用的是NVIDIA的GPU。

寒武紀、地平線做的都是AI芯片,但是寒武紀做的是通用處理器,地平線是面向自動駕駛等特定場景的專用處理器。而且商業模式有所區別,寒武紀同時兼顧雲端和終端,在終端市場以賣IP為主,地平線更多專注於終端市場,提供芯片加算法的解決方案。

三家公司對比,商湯科技的商業化是做的最好的,在國內人臉識別領域無出其右,通過智能手機、短視頻平台將人臉識別技術迅速落地,成為一隻賺錢的“獨角獸”。寒武紀IP通過華為麒麟芯片也已實現商用,而地平線尚無大規模商用。

地平線放棄手機市場而專注於自動駕駛,選擇了一條更艱難的道路。因為把人工智能應用於自動駕駛的難度要遠遠大於智能手機,自動駕駛面對的場景更加複雜多樣,路況、氣象和行人的影響都非常大。

實際上,谷歌、NVIDIA、英特爾、百度等巨頭,他們的自動駕駛項目仍處在測試階段,距離正式商用還有很長一段時間。地平線目前做的就是為若乾年後L3、L4商用做技術儲備。

但並不是說等到自動駕駛完全實現了,才進入市場、進行商業化。“實際上,地平線從2級的輔助駕駛,到3級的半自動駕駛和4級的自動駕駛,我們在每一階段都會給行業、企業提供處理器。”余凱說。

“中國做人臉識別的公司,能找出50家,恐怕都不止;做自動駕駛的,能找出30家,估計也不低於這個數。但是做自動駕駛技術+芯片的公司,目前國內只有1家,就是地平線。”對於地平線來說,現在要做的,就是先讓自己跑得足夠快。

獲得更多的PTT最新消息
按讚加入粉絲團