每日最新頭條.有趣資訊

挑戰NVIDIA 依圖造芯震撼發布,極智“求索”算法即芯片

新智元原創

編輯:木青、三石

【新智元導讀】今日,依圖重磅推出了擁有世界級算法優勢的雲端AI芯片——求索(questcore)。這是依圖推出的第一款雲端深度學習推理定製化 SoC芯片,專為計算機視覺領域分析任務打造。性能秒殺NVIDIA!

算法即芯片的時代來了。

在今天的年度發布會上,擁有世界級算法優勢的依圖科技重磅推出雲端AI芯片——求索(questcore)!為AI芯片開辟了一條新道路。

選擇在擅長的領域繼續發揮優勢。“求索”是依圖推出的第一款雲端深度學習推理定製化 SoC芯片,為計算機視覺領域分析任務打造,針對視覺領域的不同運算進行加速,適用於人臉識別、車輛檢測等多個應用場景。

加入“造芯”陣營後,依圖科技瞄準其擅長的計算機視覺領域,再度打出重拳,這一拳打破了算法公司與芯片硬體公司的“次元壁”。

“求索”已來:雲端AI芯片市場再添新玩家

在發布會現場,依圖聯合創始人兼CEO 朱瓏談到了AI芯片為何難做,用了三個“沒有”作為排比句:

沒有典型場景應用就沒有意義;

沒有超越NVIDIA的芯片就沒有意義;

沒有世界級的算法就沒有意義。

如果一款AI芯片沒有定製方向、沒有超過業內最大咖的玩家、沒有頂級算法作為支撐,那麽這款芯片就不能稱為是成功的,這也是依圖所面臨的挑戰。

依圖科技的確擁有世界級的算法優勢,但它並非芯片創業公司,在投入大、門檻高的芯片行業,一開始就選擇了高端玩家頗多的領域進軍——自研雲端 AI SoC,頗有要挑硬骨頭下手的意思。

先來看下規格:

類型:系統級芯片(SoC);

架構:ARM+ManyCore;

製程:16nm

工作記憶記憶體:LPDDR4X;

解碼:64路全高清實時。

發布會現場,依圖科技首席創意官呂昊為大家進行了芯片演示——他手持一台體積與15 英寸蘋果 MacBook Pro筆電相當的依圖原子伺服器,成功帶動200路攝影頭同時完成實時智能視頻分析任務。

剛開始大螢幕隻顯示了伺服器處理的27個攝影頭畫面——一個NVIDIA P4顯卡大概只能處理27個攝影頭。緊接著,大螢幕畫面突然顯示了原子伺服器同時帶動200個攝影頭的畫面:

一場直觀的新品考驗。

依圖原子伺服器基於questcore 打造,一台伺服器提供的算力與 8 張NVIDIAP4卡伺服器相當,而體積僅為後者的一半,功耗不到20%。在進行視頻解析時,1台依圖原子伺服器(搭載4核 questcore芯片,除此之外無需其他配置),與8卡NVIDIAT4伺服器(含雙核英特爾 x86 CPU)對比,單路視頻解析功耗僅為後者的 20%,與8卡NVIDIAP4 伺服器(同樣含雙核英特爾 x86 CPU)相比,功耗約為後者的10%。

questcore可獨立運行,自研架構,實現高性價比

這款芯片作為伺服器芯片可以獨立運行,不依賴 Intel x86 CPU,並且採用依圖自研的ManyCore架構,具有靈活可拓展的特質,適配各類深度學習算法。

從這些特性來看,這款雲端芯片更看重“實用”二字——如何滿足更多的需求、如何將本有的算法優勢在芯片上發揮更大的作用、如何適應現有的生態。

簡單來講,它致力於解決一個實在的問題——如何實現高性價比

“利用算法優勢”成為全場發布會的一大關鍵詞。依圖認為,好的算法才能更高效地利用芯片架構,才能指導芯片架構設計,把算力更高效地轉化為智能。這款芯片基於領域專用架構(Domain Specific Architecture,DSA)理念,專為計算機視覺應用而生。

questcore是款“自立自強”的芯片:它作為伺服器芯片可以獨立運行,不依賴 Intel x86 CPU。這也是依圖芯片與NVIDIA GPU、Google TPU和其他AI芯片公司研發的AI加速器產品一個很大的不同。

另外,這款芯片採用依圖自研的ManyCore架構,據介紹,同等功耗下,這款芯片能提供市面現有同類主流產品2~5 倍的視覺分析性能。

如果一款芯片想要實用性強,就必須擁有強大的可拓展性,以便應用於更多的場景。ManyCore架構能夠適配各類深度學習算法,支持TensorFlow、PyTorch、Caffe等各類深度學習框架,便於無縫接入現有生態。在此架構下,questcore構建的產品和解決方案可以兼顧雲端和邊緣計算的需求

據依圖科技向新智元介紹,這款芯片能實現性能和功耗比呈量級提升的根本原因之一是:ManyCore架構針對INT 8數據(8 位整數數據類型)進行加速。

事實上,對於雲端 AI 推理或者說視覺推理計算而言,並不需要高精度的計算,低精度的INT8 數據類型已經足夠滿足需求。採用16nm製程也是考慮現在業界對視覺分析應用的需求。

在投入極高的芯片行業,如何實現高性價比是眾多玩家要實際面對的終極問題,算力的提升正是為了解決AI場景中的經濟學難題——用更少的成本解決更多的問題

投資AI 芯片初創團隊ThinkForce,依圖邁向算法芯片一體化

在發布會上,依圖表示未來立足“算法+芯片+數據智能”的極智戰略,深入行業,降低人工智能應用落地和推廣成本,賦能行業。

據介紹,questcore芯片的設計和研發正是依圖算法團隊和ThinkForce團隊緊密合作的成果。

事實上,依圖科技在AI芯片領域內早有布局。2017年底,依圖正式對外宣布戰略投資AI芯片初創團隊ThinkForce。ThinkForce是中國少有的擁有芯片研發全鏈路能力的團隊,核心成員來自 IBM、AMD、Intel、ZTE 等芯片業界龍頭企業,全都擁有十年以上專業芯片研發設計經歷,經手過40余款不同芯片的量產。

有了如此高配的芯片研究團隊,打破算法與芯片的“次元壁”不再是難事,軟硬體一體化的產品也因此誕生。

事實上,次元壁本就不應該存在。市場上並不存在單獨能夠使用的軟體或硬體,整個行業、整個生態一定是緊密結合在一起的。

這款芯片將於與依圖智能軟體結合在一起,構成軟硬體一體化的產品或解決方案對外銷售,未來將應用於交通運輸、公共安全、智慧醫療和智慧零售等行業。TO B服務崛起之下,軟硬體一體化正成為一家AI企業的商業優勢,可以為客戶提供針對特定場景優化的性價比最高的解決方案。

AI芯片市場逐漸擁擠:“造芯”路上,定製化是未來方向

與依圖科技相似的是,Google、微軟、阿里等科技巨頭也在自研芯片:同樣也是通過利用自身特有優勢,從而為客戶提供更好的軟硬體一體化解決方案。越來越多企業加入了轟轟烈烈的“造芯”大軍。

AI芯片是個全新戰場。

押寶AI芯片可以說是大勢所趨,據研究報告顯示,目前AI芯片行業生命周期正處於幼稚期,市場增長快,2022年將從2018年的42.7億美元,成長至343億美元。

與其他戰場相比,這個新戰場充滿了不確定性,以及更多的機會——一個沒有先例可循的智能時代。中國AI創企與世界科技巨頭站在同一起跑線上,完全有可能成為新巨頭,同時加速數據中心伺服器芯片自主可控進程。

美國杜克大學電子計算機工程系教授陳怡然、美國紐約州立大學教授陳逸中曾在文章《中國AI芯片有可能彎道超車》提到:人工智能應用場景千變萬化,其中應用的算法之間的差異更是巨大,可以預期未來各項應用將有不同的定製化芯片,出現人工智能芯片百家爭鳴的盛況。AI芯片的另一大特點在於它所面對的是一個全新的、還未被大公司充分定義的新的業務場景。即使是NVIDIA,也只是在雲計算這一領域有一定的壟斷地位。

定製化芯片必然是未來方向。

世界級的創新需要世界級的命題,如今AI普及也成為世界級命題。依圖聯合創始人兼CEO 朱瓏認為AI普及的關鍵是智能密度,而這裡“智能密度”指部門面積矽芯片提供的算力轉化的智能。

然而,在半導體的摩爾定律已經臨近終結,智能密度繼續翻倍不能再隻寄希望於摩爾定律。雖然半導體的摩爾定律逼近終結,但算法性能卻仍在萬倍增長,過去 4 年依圖的人臉識別算法精度提升了 10 萬倍。

同時,通用芯片已無法解決所有需求,定製化芯片與依圖questcore一樣,Google TPU也是一種DSA,針對深度神經網絡(DNN)進行加速,Google TPU充分證明了DSA的優勢。而對於DSA芯片而言,領域知識是最重要的,需要對機器視覺技術和行業有著深刻理解,這是需要人工智能公司在研發和商用落地中不斷積累的。

了解自身優勢、了解市場真正需求,提供定製化芯片成為了依圖“高性價比”的解決方案,這也為那些想要加入芯片市場的玩家們提供了一個可高度參考的路線。

正如陳怡然教授和陳逸中教授所說的那樣,一個成功的芯片項目所帶來的不僅僅是銷售芯片本身的利潤,還有伴隨芯片設計、製造以及銷售整套流程中產生的支撐產業與生態系統,從而帶動軟硬體發展、行業標準制定、知識產權銷售等產業發展。

算法即芯片,這條新路還會帶給AI公司更多的可能性。

獲得更多的PTT最新消息
按讚加入粉絲團