美國的最新禁運，會讓中國下代超算遭致命打擊？告訴你實情

作者：鼎盛微胖

最近這幾天，有許多美國媒體幸災樂禍，認為中國超算行業將受到致命打擊，離開了美國的CPU，中國將造不出超算。事實是這樣的嗎？這個禁令對我國的超算行業有什麽影響？

據多家媒體報導,在當地時間6月21日，美國商務部以國家安全為由，再次將中國的5家實體列入進出口管制的實體清單，禁止它們從美國的供應商採購零組件，相關決定於6月24日生效。這五家實體與中國超算行業的“三巨頭”中的兩位相關，涉及到“曙光”和“神威”兩款超算。這五家實體中的江南計算技術研究所就是“神威”超算的研發製造部門。而其他四家實體，中科曙光，天津海光（Higon）、成都海光集成電路、成都海光微電子技術全都與“曙光”系列超算有關。

最近這幾天，有許多美國媒體幸災樂禍，認為中國超算行業將受到致命打擊，離開了美國的CPU，中國將造不出超算。事實是這樣的嗎？這個禁令對我國的超算行業有什麽影響？本文將對這個問題進行詳細分析。

首先，美國為什麽要再次對我國超算企業進行製裁？

實際上，早在2015年初，美國商務部就將中國的四大超算中心列入了禁運清單。這源於美國長久以來的焦慮：在大約40年中，中國的超算行業從完全進口美國產品，到購買美國的CPU自己製造超算，再到使用自己的CPU和加速器製造超算; 從只有幾台超算，在全世界超算市場裡不值一提，到擁有超算的數量全球第一，大大超越美國；從擁有的超算性能低下排不上號，到稱霸全球最快超算排行榜第一名多年；中國超算行業走出了一條完美的逆襲之路。

世界超算組織top500.org每半年推出一次全球最快的500台超算排行榜。今年6月剛剛推出了最新的榜單。全球最快的500台超算數量按國家的分布圖如下：

TOP500榜單中，中國超算的數量達到了219台，佔全球的44%，世界第一；美國以116台的數量佔全球的23%，比中國落後甚多。

要知道，在僅僅一年前的2018年6月，中國在TOP500中的超算總數還是206台，美國還是124台。這一年中，中國又有了進步，美國又在退步。從趨勢來看，中國的優勢會越來越大。

由於超算在軍事，科研和經濟中的巨大作用，美國心裡的焦慮是可以理解的。他們急於抑製住中國的發展勢頭，於是就把商業誠信和公平貿易原則仍進下水道，祭出了禁運大法。那麽，這次的禁運措施對中國超算行業有什麽影響？

對中國正在研製中的三台E級超算影響不大

在2018年夏天，美國的超算SUMMIT終於排上了TOP500的第一名，把霸榜多年的中國“太湖之光”擠到了第二名，它比“太湖之光”快60%左右；接著，美國的另一台超算Sierra投入使用，它以微弱的優勢把“太湖之光”擠到了第三位。

美國的媒體興奮起來，一改多年的沉默，開始吹噓下一代E級超算的威力。所謂E級超算，是指每秒鐘運算一百億億次的超級計算機，比SUMMIT還好快許多倍。美國的E級超算計劃在2021年左右投入使用，而中國為E級超算準備了三個方案，全部使用國產CPU和加速器，也計劃在2020到2021年期間陸續投入使用。

這裡需要介紹一下加速器，超算的核心部件不止是CPU，由於超算做的是密集的科學計算工作，CPU執行這樣的計算任務並不是效率最高的，擁有眾多運算單元的加速器處理器的效率更高，比較典型的加速器芯片就是Nvidia公司的通用型GPU，以及英特爾公司的至強XeonPhi處理器。

最近幾年出現的超算有一個趨勢，就是使用一顆CPU帶多顆加速器的架構，計算任務主要由加速器芯片完成，CPU主要做協調，通訊和分配任務的工作。

那麽，美國的這次禁運對我們的E級超算有什麽影響呢？讓我們來仔細看看。

我國為下一代E級超算準備的三套方案，全都使用國產CPU和加速器芯片：

天河三號E級超算：

2018年5月19日，國家超算天津中心展示了天河三號原型機，在2018年底投入使用。天河三號的全配置主機計劃在2020年投入使用，性能計劃為1EFlops. 天河三號將使用國產飛騰FT2000plus或者後續型號的CPU，以及國防科技大學的Matrix2000plus或者後續型號的加速器芯片。

飛騰CPU採用ARM架構。

Matrix2000加速芯片是國防科大的通用DSP芯片，GPDSP，就像NVIDIA公司通用GPU（GPGPU）那樣，DSP（數字信號處理器）也擁有大量的運算單元。

神威E級超算：

神威系列超算是由江南計算機研究所研製的。2018年7月神威E級原型機落戶於國家超算濟南中心，需要三年左右的研發時間，將在2021年正式投入使用。神威的CPU肯定是申威系列的最新型號，加速器可能也會採用Matrix2000plus或者其後續型號。

申威系列CPU脫胎於DEC Alpha處理器架構。

曙光E級超算：

中科曙光主要使用X86架構的CPU。在最新的TOP500榜單裡，共有曙光公司製造的63台超算。除了一台以外，其它62台全部使用英特爾的至強CPU，有些超算還使用了NVIDIA的Tesla加速器芯片。

猛的一看，似乎這次禁運對曙光公司是致命的打擊。因為英特爾和NVIDIA的芯片以後都買不到了。但是，曙光公司早就有了全國產化布局。秘密就在這62台之外的那一台超算上。

CPU：

這台型號為TC8600的超算是2018年投入使用的，它的CPU採用的是天津海光公司的Hygon Dhyana處理器，32核，2Ghz頻率。天津海光公司在2016年初得到了美國AMD公司的第一代ZEN架構的永久授權，起點相當高，要知道AMD公司在2018年才推出第二代ZEN2的架構。海光3000系列CPU使用的是x86通用架構，完全支持Windows10 Pro， Windows Server2019， Linux Centos 7.x等主流作業系統，而且還有類似AMDEPYC的伺服器版，最多32核64線程，基礎頻率2.0GHz，加速頻率可達3.0GHz，而且涵蓋了從4核到32核在內的多個產品線。

在這次禁運公布後，海光公司無法再得到AMD新的產品架構授權，但這並不影響已經得到的授權。海光公司已經組建了超過500人的研發團隊，有能力在已經得到的授權的基礎上，進一步開發新的產品，提升CPU的性能。這也意味著未來X86架構的CPU在中國可能會產生硬分叉，我們將從此與美國分道揚鑣，走出自己的路來。

加速器芯片：

而這台曙光超算的加速器芯片更有意思：它的名稱為Deep Computing Processor。根據公開的新聞報導，曙光的加速器芯片是基於我國寒武紀公司的AI處理器架構研製的，全球獨一無二。曙光公司的通稿上說：“2017年11月，曙光基於寒武紀低功耗深度學習處理器，率先推出PHANERON，引起業界廣泛關注。時隔6個月，寒武紀發布性能更為強勁的MLU100，曙光同步升級PHANERON產品，並發布一系列搭載寒武紀MLU100的伺服器產品，保持著在智能伺服器領域的持續領先”

這意味著曙光TC8600超算應用於AI領域將擁有極大的優勢。

未來曙光公司的E級超算，應該就是基於海光公司的最新CPU和曙光自己設計的PHANERONAI加速芯片的最新版本。

由此也可以看出美國商務部的這次禁運，也根本影響不了曙光公司的E級超算產品。

禁運可能對曙光公司的商用超算產品線的影響巨大

我們還需要看到，由於曙光公司的主要產品線都是基於英特爾的CPU和NVIDIA的加速器芯片，在這次禁運之後，這些產品線都難以為繼了。從商業層面來說，對曙光公司的影響巨大。但是好在曙光有了全國產的CPU和加速器芯片替代產品。我們可以從排名第43的曙光TC8600和排名第88位的曙光TC4600LP／W740l這兩台超算的測試數據看出一些細節來：

表格來源於top500．org，筆者進行整理分析

曙光TC4600LP超算是基於英特爾至強CPU和NVIDIATesla加速器的產品。從以上測試數據來看，使用國產CPU和加速器的TC8600超算，在使用了3倍多的CPU核心數量以及5倍左右的加速器核心數量的情況下，跑分只不過增加到了1.4倍到1.7倍。但是功耗下降了很多，功耗效率提升了3倍多。

筆者分析這主要是因為TC8600採用的AI加速器並不適合傳統的浮點運算，它只是在AI運算上具有巨大優勢。

這也意味著，曙光公司缺乏合適的加速器芯片，來提升系統的浮點運算能力。這可能會對曙光公司的商業發展產生不利影響。

也許曙光公司的未來銷售重點將轉向AI運算。但是，也不排除未來曙光公司開發基於國產Matrix2000加速芯片的產品。

在這裡必須介紹一下，為何曙光公司不能放棄X86架構的CPU。

全球TOP500強的超算100％都使用Linux作業系統的不同發行版。這些版本都為各自的CPU和加速器芯片做了優化。而在超算上跑的應用軟體也會受到CPU架構的影響。

從目前來看，對X86架構優化的Linux系統最成熟，應用軟體最多，程序開發最容易，整個軟體生態系統最成熟，穩定。而國產申威和飛騰CPU的系統則有些不足，軟體工具為它們優化得少，編程也有些麻煩，系統bug也較多，整個軟體生態系統只是解決了可用，離X86系統那樣的好用仍然有一定距離。

所以，無論從國家的戰略方面，還是從曙光公司的商業前景而言，X86架構都是應該堅持做下去的。

中國半導體制造技術的進步將極大地推進國產超算CPU和加速器芯片的性能

中國的半導體制造業長期以來是我們最大的短板。在台積電和三星電子已經量產7納米工藝，英特爾已經小規模量產10納米工藝的時候，我國目前最先進的半導體制造工藝還是中芯國際的28納米工藝。

而在上面提到的國產CPU，要麽使用國產較落後的工藝，自主性能夠保證，但性能落後；要麽在海外找半導體代工企業生產，性能可以提升，但自主性無法得到保證，說不定什麽時候就會被掐脖子。

但這個狀態很快就要結束了。中芯國際在2018年8月的第二季度業界報告中宣布，其14納米生產工藝取得了重大進展，第一代FinFET技術研發已經進入了客戶導入階段。而正式量產則計劃在2019年中期。所以，很快，我們就會擁有自己的14納米半導體生產工藝了。

14納米有多厲害？要知道，現在英特爾所有的台式機和伺服器芯片都是14納米的。英特爾在剛剛過去的台北電腦展上宣布會小規模量產10納米工藝的低電壓筆電電腦處理器，並且預計未來幾年14納米仍然是它的主力工藝。只有AMD在台積電的代工下，剛剛宣布實現了CPU的7納米工藝生產。

如果國產超算CPU和加速器芯片都使用中芯國際的14納米工藝生產，它們的性能將會得到一個飛躍。

美國終將搬起石頭砸自己的腳

實際上，美國在2015年對中國的四大超算中心的禁運，已經砸了它自己的腳：英特爾的至強Phi加速器芯片停產。

圖為美國《個人電腦》雜誌當年對美國封殺中國四大超算中心，禁止因特爾提供至強Phi加速器芯片給它們的報導

筆者在這裡列一些事實：

中國的天河2號超算分別使用了3.2萬顆Xeon E5 CPU和4.8萬顆Xeon Phi加速器。

對於Xeon Phi的銷量，Intel CEO曾表示過2016年的目標是10萬顆出貨量。

可見，單單我國的天河2號就能達到Intel 2016年約一半的Xeon Phi銷量。

2015年4月9日，美國商務部宣布對中國的四家超算中心禁運英特爾的至強Xeon處理器和至強Phi加速器芯片。

2016年6月18日,至強Phi 7290/7250加速器價格直接腰斬。到2017年8月24日，英特爾宣布至強 Phi 7200系列協處理器加速卡進入停產退市進程。

圖為美國《個人電腦》雜誌在當年的報導中也提到中國市場對於因特爾這一芯片的重要性，以及美國禁令將給因特爾帶來沉重打擊

筆者毫不懷疑英特爾至強Phi加速器芯片的停產就是因為對中國的禁運。這甚至影響到了美國下一代E級超算的開發。美國的E級超算，CPU可選擇英特爾和AMD的X86處理器以及IBM的Power處理器，而加速器芯片目前只有一個選擇，就是NVIDIA的通用GPU。

那麽美國商務部的這次禁運會有什麽結果呢？筆者相信，在我們自力更生的努力之下，幾年之後，世界上會出現幾個新的超算CPU生態圈，徹底打破美國的壟斷。

實際上，美國《紐約時報》和《華爾街日報》也都不認為美國政府的這一打擊中國超算的舉動會阻礙中國的發展。這兩家媒體採訪幾位不同的美國超算專家就表示，美國政府的行為雖然短期內或給中國的超算發展帶來阻礙，卻也會更加堅定中國開發本土技術替換美國科技的決心。

而一件必然會要發生的事，就是在2020年和2021年，中國有三台E級超算將會衝擊TOP500排行榜的冠軍位置，把美國超算踢下去。讓美國看看，誰才是超算領域的王者！