每日最新頭條.有趣資訊

英偉達GPU獨佔風騷,英特爾掉隊、谷歌奮力追趕

CPU、GPU、FPGA、英特爾、英偉達、賽靈思……隨著深度學習帶來的AI的興起,芯片領域最近可謂是風起雲湧,一個個科技名詞走進公眾視野,成為網紅。AI創企也在不斷吸金,用芯片燃燒著一個又一個神話;與此同時,老牌芯片廠商,英偉達、賽靈思也在不斷被挑戰的同時,續寫自己的輝煌。

芯片,作為高端製造業的“皇冠明珠”,在不斷變小、改變架構的同時,不斷凝縮著新的科技結晶,逐漸構建出更龐大、更精致的科技帝國。

億歐推出“芯片帝國”系列分析稿件,從芯片的核心架構、應用場景、國內外主要玩家和下遊晶圓代工廠等方面呈現芯片業的產業圖景。當前AI芯片主要分為GPU、FPGA、ASIC及類腦芯片等。以下為第一篇架構篇,從通用芯片CPU及它的創始者英特爾說起,梳理AI浪潮下不同的芯片架構,及它們所構築的科技帝國。

英特爾和CPU:開山鼻祖,集成通用芯片、PC界老大

芯片中,最令人熟悉的恐怕是中央處理器CPU了。作為一種超大規模的集成通用芯片,CPU可完成多種不同種類的任務,在PC世界裡起著大腦的作用。而CPU的誕生也開始了PC時代的巨頭——英特爾的輝煌歷史。

英特爾是主要以研製CPU處理器的巨頭,全球最大的個人電腦零件和CPU製造商,1971年,英特爾推出了全球第一個微處理器,它引發的微處理器所帶來的電腦和互聯網革命,可以說改變了整個世界。

但CPU雖統治了PC時代,隨著人工智能興起,傳統的CPU算力不足這一問題便越來越突出,尤其基於CPU的傳統計算架構無法滿足人工智能並行計算的需求。AI所需的深度學習需要很高的內在並行度、大量浮點計算能力以及矩陣運算,因此在通用芯片之下,需發展適合人工智能架構的專屬芯片。這也帶來了英特爾地位的下降。

不過在更早時候,即移動互聯網大潮襲來時,CPU巨頭英特爾的劣勢就已開始顯現了。英特爾在移動端不敵來自生產ARM芯片(與英特爾X86平級的CPU架構,但採用精簡指令集電腦,主打低成本、低功耗和高效率)的ARM公司,目前世界超過95%的智能手機和平板電腦都採用ARM架構。

再加上英偉達GPU在數據中心業務的競爭,2010年還佔據整個半導體芯片市場80%多份額(據IHS的報告數據)的英特爾,到2016年第二季度,僅佔14.7%。

為了在人工智能時代不落後其他科技公司,英特爾近年來通過收購一批在FPGA、ASIC等芯片領域的頭部企業。在雲端,2015年,英特爾收購全球第二大FPGA廠商Altera;在終端,2016年收購了研發高性能視覺處理芯片的Movidius;另外,英特爾2017年還收購了汽車領域的Mobileye,以此對抗英特爾在汽車領域的地位。

不過,今年7月,英特爾交出的財報顯示,其Q2營收為169.62億美元,淨利潤50.06億美元,同比增長78%。雖然營收、淨利潤增速不錯,但基於CPU、FPGA的數據業務並未達到之前的預期,英特爾股價還是跌了。

當然,英偉達雖然目前已有頹勢,但CPU卻也沒有到馬上要被替代的地步。

CPU雖然計算能力稍差,但它是通用電腦的處理核心,處理各式各樣的指令要求,所有部件也都要通過它互聯互通,其有著複雜的邏輯控制單元和獨特的指令翻譯結構,這是其他芯片目前難以替代的。

並且,ARM架構的CPU芯片在手機和智能音箱等領域也是不可或缺的。所以唱衰CPU,還是為時過早的。

英偉達和GPU:先發製人的“十項全能”選手,目前應用最廣泛AI芯片

CPU的計算能力漸漸落後,也催生了崛起的影像處理器GPU及新的巨頭英偉達。1999年,英偉達發明了GPU,這極大地推動了PC遊戲市場的發展,重新定義了現代電腦圖形技術,並徹底改變了並行計算。

相比CPU,GPU由於更適合執行複雜的數學和幾何計算(尤其是並行運算),剛好與包含大量的並行運算的人工智能深度學習算法相匹配,因此在人工智能時代剛好被賦予了新的使命,成為AI硬體首選,在雲端作為AI“訓練”的主力芯片,在終端的安防、汽車等領域,GPU也率先落地,是目前應用範圍最廣、靈活度最高的AI硬體。

而英偉達也因此幾乎成為AI浪潮中的最大受益者,在加速深度學習算法芯片市場幾乎佔壟斷地位。英偉達2016年第一個推出專為深度學習優化的Pascal GPU,2017年推出了性能更優的新GPU架構Volta,及神經網絡推理加速器TensorRT 3。目前佔據全球GPU行業的市場份額超過70%,GPU作為其核心產品佔據84%的收入份額。

另外,由於英偉達發布的針對開發者提供的並行計算平台CUDA,被廣泛認可和普及,積累了良好的編程環境,目前應用在人工智能領域,可進行通用計算的GPU市場基本被英偉達壟斷。

不過英偉達在PC端和數據中心業務上,也面臨著老二AMD的挑戰。

在PC處理器市場,AMD正在英特爾主導的市場“搶食”。從2017年3月至今年4月,AMD推出了銳龍7、銳龍5、銳龍3、銳龍Threadripper、銳龍2000等處理器。數據顯示,在銳龍處理器推出後,AMD的桌面處理器市場份額已從8%增至12%;而英特爾的份額則下跌1.9%,至87.8%。

雖然,英特爾在數據中心處理器市場也佔有絕對的領先地位,擁有99%的市場份額,不過野村證券稱英特爾正在試圖阻止將15-20%的數據中心處理器份額讓給AMD。

目前GPU和英偉達,在人工智能浪潮下,可以說是風頭正勁,不過在頂著“應用最廣泛AI芯片”的光環,英偉達也還面臨FPGA和ASIC等專用化程度更高、計算力更強的芯片的挑戰。

賽靈思和FPGA:“變形金剛”,算法未定型前的階段性最佳選擇

同樣能滿足更高的計算需求,並可進行編程,1984年,賽靈思(Xilinx)發明了現場可編程門陣列FPGA,FPGA作為半定製化的ASIC(專用集成電路),順應了電腦需求更專業的趨勢,成為神經網絡算法中的主流芯片。

FPGA可算是芯片界的“變形金剛”,在寫入軟體前它有勝於CPU的通用性,寫入軟體後它有類似於ASIC的表現,是算法未定型前的階段性最佳選擇。FPGA相比GPU具有低功耗優勢,同時相比ASIC具有開發周期快,更加靈活編程等特點。

在現階段雲端數據中心業務中,FPGA以其靈活性和可深度優化的特點,有望繼GPU之後在該市場爆發;在目前的終端智能安防領域,也有廠商採用FPGA方案實現AI硬體加速。

FPGA市場的最大玩家是其創始者賽靈思,除了“通過系統集成和先進的‘軟體定義’開發環境所擴展的新用戶群體的服務”外,賽靈思在金融、製造業、娛樂、公共安全以及電信等傳統行業,以及在自動駕駛汽車、無人機、智能監控等新興行業都有布局。

在數據中心方面,全球七大超大規模雲服務公司,已有3家採用了賽靈思FPGA,其中的百度於今年10月宣布,其已設計出賽靈思UltraScale?FPGA池。另外,賽靈思在車用電腦視覺處理市場佔有率排名第二,僅次於Mobileye(2017年被英特爾收購),不過其與Mobileye間還存在著巨大差距。

賽靈思今年還收購了我國的人工智能創企深鑒科技,深鑒基於賽靈思的FPGA開發AI芯片,此前已和大華股份、東方網力等安防廠商展開合作,推出基於Xilinx FPGA的DPU產品。

除賽靈思以53%的份額(谘詢公司Gartner2016年數據)佔據FPGA市場頭把交椅外,阿爾特拉(Altera)以36%的份額位居其後。2015年6月,阿爾特拉被英特爾以167億美元的價格收購後,英特爾在其基礎上成立了可編程事業部。今年4月,英特爾的FGPA被正式應用於主流的數據中心OEM廠商中,主要客戶包括戴爾、富士通等。

不過老大賽靈思在回復如何看待阿爾特拉被英特爾收購時,傲嬌的表示:“我們依舊是第一,只是尾巴丟了”。

但由於FPGA要保證編程的靈活性,電路上會有大量冗余,因此成本上不能像ASIC做到最優,工作頻率也不能太高。因而,在ASIC還並不成熟,同時GPU功耗和成本較高的現階段發展較好。

谷歌和ASIC:“專精職業選手”,專一決定效率,AI芯片未來

隨著專用化需求的進一步發展,芯片界又誕生了ASIC。ASIC(Application Specific Integrated Circuit)即專用集成電路,本文中特指專門為AI應用設計、專屬架構的處理器芯片。

近年來湧現的類似TPU、NPU、VPU、BPU等,本質上都屬於ASIC。無論是從性能、面積、功耗等各方面,AISC都優於GPU和FPGA,長期來看,ASIC代表AI芯片的未來。

ASIC架構典型的代表,是谷歌的張量處理器TPU,其採用了脈動陣列的組織方式。2016年,谷歌TPU在AlphaGo與李世石一役中橫空出世,使AlphaGo“思考”棋招和預判局勢,處理速度比GPU和CPU快上幾十倍。令人驚豔的的TPU,也一度被認為是AI芯片業內新的攪局者。不過TPU的資歷也沒比以上幾位年輕,哈佛大學孔祥重教授在1970 s就提出了TPU的脈動陣列組織方式。

今年2月,谷歌也以Beta測試的形式開放了一直只是自用的TPU,服務的名稱為Cloud TPUs(雲端TPUs),用於雲端伺服器。今年5月Google雲端芯還發布了TPU 3.0,8月谷歌又推出一款為邊緣計算定製的Edge TPU。

不過TPU目前並不對外發售,並且要想進入更多市場,它的通用性仍需檢驗。但谷歌TPU的推出,以及測試版對中小企業的開放,還是會對英偉達帶來一定威脅。

而ASIC芯片領域,也有一大批追趕者。以我國的初創企業而言,2017年9月,華為發售的AI芯片麒麟970上的NPU(屬ASIC架構)集成了初創芯片企業寒武紀的1A處理器作為其核心人工智能處理單元。

2017年1月,地平線攜手英特爾發布基於BPU(屬ASIC架構)架構的最新高級輔助駕駛系統,12月,地平線機器人發布“旭日”和“征程”兩款嵌入式AI芯片,面向智能駕駛和智能攝影頭。

2016年,英特爾收購的視覺處理芯片企業Movidius,其研發的VPU也是ASIC芯片。

在AI算法尚處於蓬勃發展、快速迭代的今天,ASIC存在開發周期較長、需要底層硬體編程、靈活性較低等劣勢,因此目前發展速度還不及GPU和FPGA。但長期來看,ASIC是AI芯片的未來。

IBM和類腦芯片:另辟蹊徑,顛覆傳統計算架構,仍在研發

另外,在傳統架構之外,還有一類“不走尋常路”的芯片,這就是“類腦芯片”。“類腦芯片”顛覆傳統計算架構,將數字處理器當作神經元,把記憶體作為突觸,記憶體、CPU和通信部件完全集成在一起,採用模擬人腦神經元結構來提升計算能力。

“類腦芯片”以IBM TrueNorth芯片為代表,但由於技術和底層硬體的限制,其尚處於前期研發階段,目前不具備大規模商業應用的可能性。從技術成熟度和商業可行性兩個角度,使用AI專屬硬體進行加速運算是今後五年及以上的市場主流。

我國初創企業西井科技也在研發類腦芯片,其宣稱“芯片用電路模擬神經,成品有100億規模的仿真神經元,可用於基因測序、模擬大腦放電等領域”。

不過,類腦芯片的商用並不樂觀,西井目前也從研究類腦芯片轉向自動駕駛領域。

總結:諸侯混戰,同賽道糾纏,不同架構競爭

從CPU、GPU、FPGA,到ASIC及類腦芯片,從英特爾、英偉達、賽靈思、谷歌再到IBM,可以看出芯片業最近50年可謂風起雲湧,而人工智能芯片的興起只是最近的一次浪潮。

GPU、FPGA、ASIC及類腦芯片等可用於AI的芯片,也只是目前登場的芯片中的一小部分,其商用場景還未完全展開。而當前的AI芯片中,應用還是以GPU領先,FPGA可能成為下一個爆點,ASIC目前是被看好、但不成熟的新星。

再看芯片巨頭的鬥爭,英特爾與ARM在CPU市場、英偉達和AMD在GPU市場、賽靈思和阿爾特拉在FPGA市場上,及谷歌和一些創企在ASIC市場的競爭……而在AI浪潮下引導的芯片革新上,英特爾與英偉達,賽靈思以及谷歌又在不同芯片架構及應用場景間進行鬥爭。

可以說這確實是一場“諸侯混戰”,而身處變革中的每一個巨頭,都不想在戰爭中先倒下。

獲得更多的PTT最新消息
按讚加入粉絲團