每日最新頭條.有趣資訊

成為“AI芯片之王”,要燒掉多少錢?

30秒快讀

一份布滿愁雲的財報,暗示著芯片廠商們的又一場戰事拉開序幕。

7月24日,英特爾在今年2季報中宣布,因7nm芯片工藝存在缺陷,進展落後與原計劃的6個月,同時量產日期也被推遲了近一年。

當天,英特爾收盤暴跌16.24%。

另有媒體報導,英特爾已將2021年6nm芯片代工訂單交於台積電,後者還有望獲得5nm、3nmCPU芯片的代工。

受該利好消息刺激,7月27日台積電創下83.4美元/股的歷史新高。截至7月29日收盤,台積電的市值高達4289億美元,是當天英特爾收盤市值的兩倍多。

台積電和英特爾市值對比,圖源:東方財富網

一憂一喜間,暗示著英特爾自銷自產的時代落幕。曾經的CPU芯片巨頭如今陷入頹靡。但江湖中,後浪們正在奮起追逐。

7月20日,國產AI芯片第一股寒武紀登陸A股科創板,當天大漲229.9%。

7月17日,寒武紀發布科創板上市公告,圖源:寒武紀

當人工智能進入越來越多人的生活,這片江湖爭奪或許會聚焦於AI芯片上。

根據Gartner預測,全球AI芯片的市場規模將有望從2018年的42.7億美元上升到2023年的323億美元,2019-2023年平均增速約為50%。

如果說,英特爾和NVIDIA象徵著CPU、GPU芯片的榮光,那麽在AI芯片賽道中,誰會是下一個霸主?

01

從CPU、GPU到xPU

深度學習是目前AI的神經網絡主流算法,需要處理大量非結構化數據和“蠻算”。這對芯片的多核並行運算、片上存儲、帶寬、低延時訪存等提出了較高需求。

事實上,CPU芯片可以用於AI運算,適用於邏輯複雜的串行計算。由於CPU中有晶體管用於構建控制電路和高速緩衝記憶體,縮減了計算單元的空間,也在一定程度上限制了算力。

CPU集成電路上有數以萬計的晶體管,圖源:英特爾

目前深度學習下的圖像識別、語音識別的計算主要涉及矩陣向量乘法、加法,計算邏輯也不複雜,主要靠數據大量多次計算,因此相比串行運算的CPU,具有並行運算能力的GPU芯片性能更高,更適合深度學習。

CPU和GPU架構對比,圖源:OmniSci

這是為什麽GPU一哥NVIDIA能在AI芯片市場佔有一席之地。據廣證恆生研報數據,NVIDIA在數據中心GPU市場佔有率超過80%。2019年度,NVIDIA數據中心業務收入佔比增長至接近三成。

除了CPU、GPU外,ASIC被認為是下一代AI芯片主流架構。針對特定任務專門設計框架,ASIC芯片能在快速提升算力的同時降低能耗。

ASIC專用集成芯片架構,為特定應用需要而設計製造的集成電路,圖源:AnySilicon

谷歌的TPU(張量處理單元)便是其中之一。谷歌定義了十幾個為神經網絡計算而設計的高級指令,採用單線程控制,避免緩存、多道處理等問題,提高了深度學習運算效率。不過,和所有ASIC芯片一樣,TPU是一款非通用芯片。

谷歌TPU芯片,圖源:Google Cloud

在眾多xPU芯片中,Graphcore推出的IPU(智能處理單元)是一款激進產品。

這款專為AI訓練、推理任務設計的新型處理器,運用大規模並行同構眾核架構。

Graphcore推出的IPU(智能處理單元)芯片,圖源:Graphcore

加州大學聖芭芭拉分校教授謝源曾表示,在運算過程中,把數據從記憶體搬到處理單元所需能量佔比非常大,而數據搬運效率不會因摩爾定律發展而提高。

IPU採用的是大規模分布式片上SRAM(靜態隨機存取儲存器),數據不儲存在片外,意味著運算過程中可以直接調動,節省能耗和時延。不過,一旦供電不足,會導致部分數據缺失。為此,IPU相應減少了用於機器學習運算單元面積。

IPU芯片內部結構,圖源:Graphcore

日前,Graphcore已發布第二代IPU GC200,晶體管數量高達594億個,內部有1472個獨立的處理器內核,能夠執行8832個獨立的並行線程,均由900MB的RAM支持。

裝有4個IPU GC200芯片的機器,每一枚芯片內有高達594億個晶體管,圖源:Graphcore

此外,IPU GC200芯片另一亮點為能適用於稀疏樣本數據的深度學習。

新的架構有的方法是為每個處理核心配備了專用存儲單元,能更有效分散和搜集信息,避免部分數據被過濾。

Graphcore曾被多家媒體對標為下一家NVIDIA。

介紹這款特立獨行的產品時,高級副總裁兼中國區總經理盧濤表示,“IPU不是GPU,但現在很多芯片公司做的其實還是GPU,在某些領域,未來一段時間裡,IPU可能會和GPU呈現競爭膠著狀態,“這是最大的挑戰,也是最大的機會。”

02

垂直領域突圍戰

對於不少中國AI芯片企業而言,選擇做專用芯片還是通用芯片,是一道難題。

億歐科創事業部商業分析師張繼文直言,目前行業中還沒有誕生一款真正意義上的AI通用芯片,因為不同場景下,對芯片算力有不同要求。

比如,安防領域對圖像處理要求比較高,智能家居對語音處理要求很高,而自動駕駛需要多模態處理。

“現階段設計者仍在具體場景下摸索,建議做垂直領域的芯片。”她表示。

如果你是一個不走心的芯片設計師,做出芯片並不難。如果不願意付ARM框架授權費用,可以選開源的Risk-V框架,去除無用功能後,從GitHub下載代碼,交由芯片廠家做模型轉換。

圖源:GitHub

但在中科院自動化研究所研究員王金橋看來,這樣的算法無法保證算法的精度。

設計芯片時,設計師需要對網絡規模、參數、效果等選項不斷調整,提高芯片的適配能力。如果芯片已經固定了支持的網絡結構,之後要想更換,只會前功盡棄。

根據億歐智庫數據,ASIC芯片的開發費用高達800-2500萬美元以上,開發周期長達1-3年。這是耗費的資本。

這便是專注於ASIC芯片研發,寒武紀的困頓。在招股書上,寒武紀預計今年淨利潤虧損4億元至6.5億元。尋求資本市場融資,是這次寒武紀上市的緣由。

寒武紀近幾年財務狀況,圖源:寒武紀招股書

據悉,寒武紀計劃分別以IPO募集資金7億元、6億元、6億元和9億元用於投資雲端訓練芯片及系統、新一代雲端推理芯片及系統、新一代邊緣端人工智能芯片及系統和補充流動資金。

圖源:寒武紀招股書

比資本更重要的,還有人才。王金橋感慨AI芯片領域設計人才稀缺。在成為芯片設計師前,需要至少3-5年的工作經驗。

行業一流的設計師,起碼要在生產線上跟過10年,以防流片失敗。

芯片生產過程中,流片是從設計走向量產的關鍵一步,這需要按照圖紙在晶圓上進行蝕刻、制定晶圓尺寸,工藝複雜,整個過程有40多道工序,每一步細小失誤的累積,便會功虧一簣。

此前小米澎湃S2流片失敗5次,被報導稱燒掉十多億元。這是流片背後的痛。

網上關於小米澎湃S2流片失敗5次燒掉幾十億的傳聞,圖源:網絡

目前AI領域稀缺的是設計,懂算法的,不懂硬體,反之亦然,這需要建立好生態,改變高校課程結構。

王金橋表示看好寒武紀的成長,這個團隊來自中科院,有核心技術,只是成立不過5年,仍顯稚嫩。“中國會有一家像NVIDIA一樣的企業,雖然還有很長的路要走。”他說。

作者/IT時報記者 孫鵬飛

編輯/挨踢妹

排版/黃建

圖片/PxHere、東方財富網、英特爾、OmniSci、

Google Cloud、Graphcore、GitHub、億歐智庫、寒武紀招股書、網絡

來源/《IT時報》公眾號vittimes

獲得更多的PTT最新消息
按讚加入粉絲團