每日最新頭條.有趣資訊

比拚浮點運算速度,超算排行榜是這樣“算”出來的

科技日報記者 過國忠 通訊員 梅國英 吳婷

6月17日,新一期全球超算500強榜單出爐,入選500強的所有超算浮點運算速度都突破每秒千兆次,中國超算也在前四佔有兩席位置。

普通計算機用指令運算速度衡量計算性能,而超算通常用浮點運算速度來衡量其性能。那麽,什麽是浮點運算速度,超算榜單為什麽會選擇浮點運算速度來進行比較?500強特別是前十的超算,科學家們都在想哪些辦法讓浮點運算速度越來越快?節能環保是對超算的另一衡量指標,超算要節能環保,最新的研究思路和實現策略又有哪些?6月19日,科技日報記者帶著這些問題,走訪了業內相關專家。

浮點運算速度

衡量超算性能的基準程式之一

“超級計算機被稱為‘國家重器’,屬於國家戰略高技術領域,是世界各國競相角逐的科技最高點。目前,高性能計算機領域市場競爭日趨激烈,美國、歐洲、日本和中國都在加速超級計算機的研發。”國家超級計算無錫中心主任楊廣文說。

“浮點運算速度是指計算機系統每秒可以處理的浮點操作,通常用FLOPS來表示。”江南大學物聯網工程學院副院長柴志雷副教授說,超算榜單選擇浮點運算速度作為對比參考,是因為超級計算機主要用於科學計算領域,而這些領域的計算主要採用浮點數。

江蘇理工學院計算機工程學院副院長范洪輝副教授告訴記者,浮點是指小數點位置不固定的數,它們執行的算術運算會消耗大量計算資源並可能產生誤差,所以部門時間內浮點運算的次數,是衡量超算性能的基準程式之一。

常州信息職業技術學院軟體與大數據學院錢銀中博士表示,計算機只能存儲和處理整數,通過整數乘以某個基數的整數次冪,是計算機表示實數尤其是小數的方法。

“浮點運算在運算數大小變化範圍很大的場合可以實現很高的計算精度,是科學研究中的典型運算。大多數處理器中,都有專門處理浮點運算的浮點運算單元(FPU),FLOPS就是浮點運算單元的執行速度。”錢銀中說。

中國高性能計算重點研發專項總體組組長、中山大學數據科學計算機學院院長錢德沛表示,選用浮點運算速度作為超算運算能力的評價標準,是因為科學工程計算軟體中包含了大量的浮點數運算,浮點運算速度快的計算機通常也能夠更快運行相關的科學工程計算軟體。

把複雜的工作細分

超算界沒有最快只有更快

超級計算機具有很強的計算和處理數據的能力,主要特點表現為高速度和大容量,配有多種外部和周邊設備及高性能軟體系統。現有的超級計算機運算速度,大都可以達到每秒一兆次以上。

常州信息職業技術學院電子工程學院牛傑博士介紹,超級計算機的創新設計在於把複雜的工作細分並分配給不同的處理器。根據阿姆達爾定律,超級計算機的設計都集中在減少軟體序列化、用硬體在瓶頸上加速。

目前,世界排名前十的超算,基本都是通過優化CPU(中央處理器)與GPU(圖形處理器)之間的連接網絡結構來提升GPU和協處理器性能,增加記憶體容量、擴充存儲容量、增大網絡帶寬、借助運算加速卡等方式提升算力,最終在高性能計算系統、網絡架構、系統軟體、應用支撐等關鍵技術上取得突破。

柴志雷認為,提升超級計算機系統的浮點處理能力,不是單純讓浮點運算本身更快,而是從整個系統的角度,提升芯片工藝,優化系統架構、節點計算性能、存儲訪問性能、節點間通信等,從而使得系統的整體能力得到提升。目前,還經常採用在系統中增加加速器等方法,來獲得更高計算效率。

錢銀中介紹,實現超算的技術有大規模並行計算法,這種方法使多個處理器一起工作,每個處理器處理一個大問題中的不同任務。這種方法有兩種實現途徑:一種是網格計算法,多個計算機連接成分散的分布式結構,分屬不同的控制區域,當需要計算機時從中擇機選擇;另一種是把處理器組織為關係緊密的集群。現代超算使用無限帶寬系統、三維環面互連等技術,在大規模並行系統中提高集群的速度和靈活性。

國家超級計算無錫中心先進製造部部長任虎介紹,目前,提高浮點運算速度的方法主要有:提高芯片計算核心的時鐘頻率,增加芯片中計算核心的數量,通過多流水線、乘加融合(FMA)等技術增加部門時間內處理浮點運算的能力。

例如,曙光星雲採用了自主研發的超並行處理體系結構、神威藍光超算採用了大規模並行處理體系結構、天河一號採用了多陣列可配置協同並行體系結構、天河二號採用了自創的新型異構多態體系結構。此外,互聯網絡、存儲、系統軟體、應用軟體、電源和冷卻等系統都對超算的性能有著重要的影響,所以超算的世界裡沒有最快,只有更快。

Green500 超算界針對能效的排行榜

“節能環保是衡量超算的另一指標。超算中心是高性能計算機的規模應用,功率密度高,且長期運行在高負荷率條件下,耗能極高。通過優化軟硬體配置確實能降低一部分功耗,但最根本源頭是要研發計算性能優異且超低功耗的高性能處理器。目前,如何實現低能耗的超算是全球科學家研究的熱點問題。” 范洪輝告訴記者。

牛傑介紹,超算界還有一種被稱為“Green500”的排行,就是以計算機每瓦功耗可以提供的計算速率為指標,針對超級計算機能效的排行榜。

從歷年的評測結果來看,刀片伺服器一般比集群式伺服器更節能,被廣泛使用在超算系統中。Green500排名靠前的前三大系統都採用了PEZY加速器,而前十大的其余系統則使用NVIDIA GPU作為加速器。其中,PEZY系統採用的是液體冷卻方式,也就是說,整個系統浸沒在液體中,這比透過板載空氣或水更具有節能效率。

超算深騰7000可以實時定位計算機的熱源分布和結構特點,採用取消全部風扇、在每套機櫃內安裝噴淋蒸發冷卻循環系統的方法,完成了產品的實施。該項目與傳統的風冷、水冷技術相比,具有冷卻效率高、溫度分布均勻、低噪音、低功耗、可靠性高等優點。

相對風冷,中國的“神威藍光”超算中心,利用複雜的水冷系統,實現CPU、記憶體、元器件的冷卻並帶走熱量,幾乎不損耗水且無噪音,先進環保,就像三明治夾心,水冷板被緊緊地夾在兩塊CPU板中間,無縫同步散熱。

如何讓超算實現低能耗?柴志雷認為,低功耗計算也是超級計算機研製的重要方面,從芯片製造、架構設計、軟體設計多個層次都需要做大量的工作。比如在架構設計上,可以通過增加異構加速單元,提升系統的能效比。

范洪輝提出,重點應降低每個部件的耗能,尤其是CPU的能耗。同時要改善記憶體件的設計,減少數據行進的距離;讓高性能記憶體向三維擴展而不是朝二維延伸;超算要與閃存結合,來改變電壓或頻率等節省功率;其次,可以採用包括能模擬大腦內神經元操作的神經形態電路或量子計算模式,創造出新型的計算機,比如生物計算機和量子計算機。

令人欣慰的是,我國正在通過多方面發力,讓超級計算機更節能環保。例如,曾獲中國專利獎優秀獎的“基於物聯網技術的數據中心動力環境監測系統”,採用超低功耗的無線數據采集技術、三維建模及虛擬仿真技術、智能分析技術等,有效消除了機房內局部熱點,解決了功耗特別大的難題,實現超算中心安全穩定和節能的目標。

來源:科技日報 文中圖片除注明外均來自網絡

編輯:劉義陽

審核:王小龍

獲得更多的PTT最新消息
按讚加入粉絲團