每日最新頭條.有趣資訊

大國博弈,不可回避的“超算之戰”

文|強家宏

編輯|封成

在《三體》裡,大劉有這麽一段描述:

“這些顯示器太舊了。”雷迪亞茨說。

“但它們後面是世界上最強大的計算機,每秒可以進行五百兆次浮點運算。”

這時,一名工程師來到艾倫面前,“博士,AD4453OG模型這次走通了。”

每秒500兆次浮點運算的計算機,出現在“面壁計劃”裡,這是第二位面壁者雷迪亞茲看到的人類最強算力,用於頂尖的核爆模擬。

2019年,人類的最強超算,是《三體》所描述的297.2倍。

人類算力的發展速度,比科幻還科幻。

01

計算的本質是模擬。

20世紀60年代,“東方紅一號”上天最大的攔路虎,就是如何精確地計算出衛星在太空中運行的軌道。因為我們當時所能使用的,是功能和效率都十分落後、需要手工操作的半自動手搖式計算機,計算員們24小時不間斷地像工廠裡的工人一樣“三班倒”才終於算出了“東方紅一號”的軌道數據,據說計算任務緊迫之時甚至動用了算盤。

先輩不易。時至今日,航天任務中龐大的計算量早已超出我們的想象,倘若我們的計算技術還停留在手工計算的那個年代,動員全國人民一起幫航天部門計算,假設每人每秒可以完成一次運算,航天任務要求在1秒內完成的運算量就足夠全國人民算上兩三個月。

好在我們有了超級計算機,它所做的事情,叫做“高性能計算”(High performance computing,HPC)。

現在世界上已知的最強計算機“頂點”,它的運算速度可以達到每秒14.86億億次的浮點運算速度,由美國能源部麾下的橡樹嶺國家研究室於去年6月研發。簡單科普一下,你可以大致將浮點運算理解成對小數進行計算的運算模式。

一言以蔽之,超算從本質上來說是一個大規模的計算工具。眾所周知,個人電腦一般只有一顆CPU(GPU),每顆CPU內通常只有2-8個物理核心,一般的應用場景如遊戲、視頻背後的程序只需用到少量的浮點計算,普通的PC當然可以滿足。但需要處理超大計算量的科學計算往往需要進行大量複雜的浮點計算,這時PC的計算能力就顯得捉襟見肘了。

大道至簡。一個很符合邏輯的辦法就是,一台機子不行,那就把千千萬萬台機子連起來啊,正因如此,業界關於超級計算機的完整定義是“由超過百個處理器組成的、能夠完成普通PC機和伺服器不能完成的大型複雜課題的計算機。”

超算如要溯源,避不開圖靈。沒錯,就是你想到的那個“計算機之父”。

2014年,一部名為《模仿遊戲》的英國電影上映,主角正是由“卷福”飾演的阿蘭·麥席森·圖靈。

故事圍繞盟軍破譯德國密碼系統“英格瑪”展開,“英格瑪”的複雜之處在於,每天深夜自動切換密碼,有 10^16 種不同的變化,用人工計算的方法根本來不及在下一次切換前破解。

圖靈是當時的數學理論高手,應召而來。他在分析了大量的德國電文後,發現許多電報有相當固定的格式,以此為突破點,他想到了用“候選單詞”這一方法來破譯“英格瑪”電文,並提出了“唯有機器才能擊敗機器”的理論。

他率領軍情六處的一眾科學家秘密研發破譯密碼的機器,並於兩年後成功破解了德軍密碼。

丘吉爾對圖靈的貢獻給予了至高的評價:“圖靈是二戰中最大的功臣,他的研究扭轉了歐洲乃至整個世界的戰局!”

這是人類最早利用計算機破譯密碼的例子。

如果用今天最快的超算“頂點”暴力破解的話,大概就是不到0.1秒的事情。

時間來到1976年3月,在美國伊利諾斯大學兩台不同的IBM 360電子計算機上,兩名數學家哈肯和阿佩爾用了1200個小時,作了100億個判斷,終於在6月份發現沒有一張地圖是需要五色的,從而證明了“四色定理”,並在《伊利諾伊數學雜誌》發表了《任何平面地圖都能用四種顏色染色》的論文,轟動世界。

速度,當然是超算的核心,運算速度更快意味著一切繁複的運算和模擬會更快、更準確。用“窮舉法”證明猜想的正確與否,是超算為解決疑難雜症另辟的蹊徑。

02

1976年,中國的第一台超級計算機,運算峰值速度只有每秒1.6億次。

改革開放之後,許多尖端科技對華解除了封鎖。那時候流行的一句話是,“造不如買,買不如租”,我們的政策也變成了“以市場換技術”。

好景不長。1989年,美國政府開始嚴格限制對中國出口高性能計算機,除了必須用天價採買之外,還要把計算機放在透明的玻璃房裡,而鑰匙在美國人手中,每次使用的用途都要向美國人報告,請求批準。

事實就是,從超算出現到2009年將盡70年的時間裡,TOP 1就一直是美國人的專利,和中國沒有半毛錢的關係。

於是有了意在提高我國自主創新能力的“863計劃”。

在超級計算機界,每隔一段時間就要篩選出全球計算能力最強的500台超算,發布到一個被稱為TOP 500的排行榜中。2001年前,TOP 500中沒有一台是中國的超算,轉機出現在2004年,曙光公司研製的“曙光4000”十兆次計算機進入TOP 500 排名前十位。2008年,“曙光5000”百兆次計算機再次進入TOP 500前十位。

這一時期雄踞榜首的是IBM的“藍色基因”。

2009年算是中國超算發展史上的里程碑。這一年,國防科技大學研製的“天河一號”千兆次計算機,使我國成為繼美國之後世界上第二個研製成功千兆次計算機的國家。

2010年6月,曙光公司研製的“星雲”千兆次計算機首次登上TOP 500的第二位,及至下半年發布的榜單,升級後的“天河-1A”力壓群雄拿下全球超算TOP 1,實測運算速度可以達到每秒2570兆次。

21世紀的第一個十年,國際超級計算能力達到P級計算(1 PFlops,千兆次計算,每秒鐘可執行10^15次雙精度浮點計算)級別,中國人第一次站在全球算力的頂端。

科學研究、軍工行業、能源領域、生物醫藥、天氣預報、工業製造,這些都是超算傳統的應用領域,各國都在為下一性能的目標——E級計算(1 EFlops,百億億次計算,每秒鐘可執行10^18次雙精度浮點計算)作準備。

2011年9月,俄羅斯聯邦原子能總署批準了《2012-2020年百億億次超級計算機為基礎的高性能計算技術構想》;2013年,歐盟啟動“Horizon 2020”計劃,其中“面向百億億次的 高性能計算”的探索基金項目將在2014-2020年投入7億歐元;2014年6月,日本文部省 宣布啟動E級計劃,用於國家高性能計算基礎設施的建設;2015年,奧巴馬政府以“國家戰略計算推進計劃”為超算規劃出了一個長期的、多機構參與的戰略遠景。

2011年,日本K-computer超越天河一號成為世界第一,這也是人類歷史上第一次突破每秒一億億次計算能力的超級計算機,2012年登頂的,是美國的“泰坦”。

行百裡者半九十,中國人拿過一次冠軍,想要再次登頂就不是難事。從2013年6月開始,“天河二號”連續6次位居TOP 500的第一名。

芯片無疑是超級計算機的核心部分,一台超算至少裝有幾千枚甚至上萬CPU和GPU芯片,同時配備特殊的作業系統,負責管理這些芯片之進行一系列複雜的運算。國防科技大學於2010和2013年建造的“天河一號”和“天河二號”超級電腦,主要使用的是由Intel和AMD提供的芯片。

面對中國超算的崛起,2015年4月,美國政府宣布製裁中國四家超算中心,並禁止向中國超算中心出售Intel的Xeon Phi超算芯片,“天河二號”不得已調整技術路線,採用國產矩陣2000替換Intel的Xeon Phi,耽擱了升級計劃。

值得我們額手相慶的是,16年接替“天河二號”位置的,是採用全國產CPU的“神威·太湖之光”,它還獲得了有超算應用界諾貝爾獎之稱的“戈登貝爾獎”。

直到2018年11月,由美國能源部麾下的橡樹嶺國家研究室研發的“頂點”才實現了美國人重返TOP 1的願望。

可來自中國超算的聲音早就不容忽視了。在TOP 500的榜單上,來自中國超算的製造廠商已經從四年前的7.4%的份額,逐漸增長為接近50%,在市場份額上也逐漸和美國並駕齊驅,2018年6月,全球超算TOP 500聯想獨佔117台,這是來自中國的製造商第一次拿到超算提供平台份額上的世界第一。

數據來源:網絡公開信息

時隔一年之後,全球超算TOP 500榜單在法蘭克福發布,中國境內有219台超算上榜,美國以116台位列第二,日本、法國、英國和德國依次位居其後。

這是2017年11月以來,中國超算上榜數量連續第四次位居第一。

在此次榜單上,聯想、浪潮和中科曙光分別以173台、71台和63台的數量位居全球超算製造商前三位,人民網微博以“中國超算:僅一個聯想,就在數量上超過了美國”為題,將消息傳回國內。

大國崛起,理應如此。

03

中國超算的研發機構有四個,三個在北京,一個在長沙。在長沙的是國防科技大學計算機研究所,兩次問鼎世界超算冠軍的“天河一號”和“天河二號”都是標準的“長沙製造”。

北京的三個超算研發機構分別是國家並行計算機工程技術中心、中科院計算技術研究所,以及聯想數據中心集團。其中,16年登頂世界的“神威·太湖之光”由國家並行計算機工程技術中心研製,中科院的超算品牌是“曙光”系列,聯想的是“深騰”。

製造世界上最快的超級計算機固然了不起,但真正推進產業應用才是關鍵。聯想作為一家商業公司,在幫助用戶“挖掘算力潛力”上堪稱極致。

“聯想會All in AI,全面擁抱智能化,不僅開發豐富多彩的智能終端,針對不同行業的smart IOT的設備,還將聚焦於超級計算、雲計算、邊緣計算。”這是聯想集團CEO楊元慶的說法。

夏日的北京,散熱系統進入端的溫度在32攝氏度左右,與最高45攝氏度的水溫容忍度有著高達13攝氏度的溫差。相比傳統風冷散熱技術,採用水冷技術的集群效率提升4000多倍,節省了40%的製冷散熱成本,節電量可達100萬度。

更重要的是,這為平台擴充計算、存儲和網絡設備帶來了總計超過100KW的配電額度,極大地提高了數據中心計算密度,數據在這種時候也許會有更強的表達力,由聯想提供的水冷高性能計算系統理論峰值是100%,最後釋放出來的算力達到92.7%。

用北京大學計算中心主任張蓓話說就是,“這次聯想水冷高性能計算系統的表現令人驚喜,能夠有效提升學校的科研支撐能力,提升學校在國家重大項目上的競爭能力,提升學校辦學實力和高端人才的吸引力。”

正因如此,聯想的超算產品在全世界都有著廣泛的應用。由聯想數據中心聯合英特爾設計製造的“超級慕尼黑-NG”(SuperMUC-NG)位列全球最強超算第九名,這一超算系統包括近6500個節點,可節省能耗超過45%,將幫助德國最大的超算中心——巴伐利亞科學院萊布尼茨超級計算中心解決來自關鍵環境、天體物理學和生物醫學領域的挑戰。

“聯想的超算技術不僅僅是放在實驗室裡面做理論研究,而更多的是與行業的應用相結合,與客戶的需求相結合,為客戶帶來真正的價值。”聯想數據中心業務集團中國區總裁童夫堯如是說。

事實上,有十個國家的最強超算由聯想交付,它們在澳大利亞、巴西、加拿大、德國、愛爾蘭、荷蘭、挪威、新加坡、南非和西班牙的土地上深根,發芽,長成參天大樹。

P級計算之後,E級計算被譽為“超級計算機界的下一頂皇冠”。它的速度是P級計算的1000倍,業內預期的時間點是在2020年,但是,要想實現E級計算,其中最重要一個問題就是功耗。而聯想的水冷技術,可以將降熱效率提升到90%。

當人們站在第四次工業革命的起點上,超算的應用遠不止於此。

對人們而言,想要分辨一隻貓、一條狗,只需看上一眼即可。但同樣的要求對機器來說,卻需要耗費大量時間。因為計算機本身是無法理解圖像、聲音這些數據信息的,所以,如果想讓機器變聰明,就要將實際問題先轉化為數學問題,即數學建模和求解。

在這一過程中,計算機需要將任務分解成多個抽象層次去處理,不同的層次間又相互疊加,同時還要完成層與層之間的監督和調度,這種海量信息處理如果沒有超算的協助,是不可能完成的。

因此業界有一種說法是,AI有三大要素:算法、大數據和計算力。如果人工智能是一輛車,那麽算法就像發動機,大數據是負責提供動力,而計算力就是車輪,驅動AI前進。

算力是聯想的強項。作為中國高性能計算的領軍者,聯想曾創下多個記錄,包括研發中國第一個兆次、四兆次、十兆次、百兆次的超算集群,以及一步步成為世界上最大的超算製造商。

“聯想已經看到,AI是信息產業的未來,聯想已經賭上身家性命去押注AI。”楊元慶在聯想第三屆全球創新科技大會上說道。

兩年後,他們在2019聯想全球超算峰會上發布的深騰X9000,就是針對HPC和AI融合所作的努力。

“聯想超算的未來,就是融合戰略,就是將高性能計算和應用結合起來。以前是大數據,現在是大數據、人工智能的融合,隨著應用的發展,可能還要融合新的東西。”這是聯想首席科學家祝明發關於集群計算的設想。

2019年是聯想HPC發展的第20年,他們正在前往一座更高的山峰。

獲得更多的PTT最新消息
按讚加入粉絲團