每日最新頭條.有趣資訊

雲計算的下個十年什麽樣?看阿里雲的答卷

2020年的疫情將重新定義雲計算產業。由於疫情帶來了線上業務的爆發,大批企業和機構將自己的線下業務向線上遷移,甚至是非常傳統的教育、農業、地產、建築等行業也開始大規模向雲遷移,導致雲計算特別是公有雲的使用量在短短的時間內就爆增到“滿倉”,例如今年初歐洲的公有雲數據中心就出現了“爆倉”的情況,而這種情況在以前都是難以想像的。

在中國市場,從2010年到2020年的雲計算產業正好經歷了一輪上升期。在2009年寫下第一行代碼、2010年推出第一代ECS彈性計算的阿里雲作為中國公有雲產業的代表,推動了整個中國市場對於公有雲的認知——從最開始的懷疑和模糊的概念,到後來逐漸接受和理清技術與市場格局,再到所有廠商的“All In”,2010年到2020年的中國雲計算產業走了啟動階段的洗禮。

那麽,2020年疫情之後的十年,雲計算產業又會有怎樣的發展?2020年7月15日,阿里雲舉辦了阿里雲彈性計算年度發布會,發布了自研的第三代神龍雲伺服器及新一代ECS產品家族。阿里雲彈性計算負責人張獻濤在談到下一個雲計算十年的時候強調,雲計算模式將反向重構基礎硬體和軟體,阿里雲正在推進的自研軟硬一體化架構和全面雲原生化,就是為了重構雲計算基礎設施,也是對未來的思考。

公有雲體系對基礎設施的反向重構

阿里自研的神龍伺服器那麽好,能買一台搬回企業自己的數據中心裡麽?阿里雲彈性計算負責人張獻濤在2020阿里雲彈性計算年度發布會後接受訪談時笑說,有不少企業客戶在了解了神龍伺服器的“爆表”性能後,提出了這個要求。而這恰恰反應了雲計算第一個十年與第二個十年的分水嶺。

先看一下神龍三代的性能:第三代神龍雲伺服器產品家族提供了最多208核、最大6TB記憶體,雲盤IOPS高達 100萬、網絡轉發高達2400萬、網絡帶寬高達100G,均為全球最高性能水準,支持CPU、GPU、NPU、FPGA等多種計算形態,具備3分鐘交付50萬核vCPU的極速擴容能力,也是雲原生的最佳載體。

從2017年推出第一代自研神龍伺服器到2020年推出第三代神龍伺服器,在短短三年間阿里雲就推出了三代自研神龍伺服器。而與上一代相比,第三代神龍雲伺服器的綜合性能提升高達160%,比目前全球最頂級雲伺服器還要快30%以上,整體算力全球最強。除了諸多的性能提升外,阿里雲ECS的單實例穩定性從原來的99.95%提升到99.975%,跨AZ多實例穩定性從原來的99.99%提升到99.995%,均為全球最高水準。

但是,企業能否買一台神龍伺服器抱回家,就獲得同樣的性能和穩定性呢?答案很簡單,不能。因為神龍伺服器並不像傳統中認知的那樣是可以抱回家的“一台”伺服器,而是融入到阿里雲的龐大基礎設施中、需要成千上萬甚至數十萬軟硬體共同協作才能發揮極致性能的“一分子”。

這就好比上個世紀改變世界的集裝箱。上世紀50年代,集裝箱的發明縮短了遠洋貨運時間85%,物流成本節省了30倍,極大推動了人類生產力的發展。但產品商並不能單買一個集裝箱抱回家就能獲得物流和生產力的收益——集裝箱離不開遍布全球的遠洋貨船、碼頭、裝卸載體系、鐵路、卡車等等完整的生態體系。從之前的散裝貨船式物流,到後來遍布全球的集裝箱遠洋物流,從購買獨立的貨船到生活在集裝箱的世界裡,人們的觀念發生了巨大的變化,而現代全球集裝箱物流體系也反過來改變了集裝箱以及整個生態鏈條上所有設施的物理形態——從1830年最早的集裝箱到1956年現代集裝箱首航,集裝箱本身也發生了巨變。

同樣的概念套用到公有雲模式中。十年前用獨立的伺服器、存儲、網絡等設備和軟體構建最初的公有雲體系,到今天遍布全球的公有雲體系將反過來重新設計伺服器、存儲和網絡等設備及軟體,最大的改變就是從獨立的個體設備到互聯的標準化設施——任何人都無法從互聯的標準化設施中單獨抽取某個組件就期望獲得整體設施帶來的收益。

對於阿里雲ECS彈性計算來說,神龍計算平台、盤古存儲平台和洛神網絡平台這些阿里自研的軟硬一體化計算、存儲與網絡設施,再加上Alibaba Cloud Linux 2.0這樣的自主品牌作業系統和雲原生軟體體系等,在雲平台之間形成更好的合力,才能釋放出更極致的性能。

下一個十年,阿里雲的答卷

過去的十年間,阿里雲從零起步,通過服務廣大客戶,逐漸打磨服務和產品。從2010年服務中小企業站長的彈性計算ECS 1.0,到2015年服務12306這樣極具挑戰場景的ECS 2.0,再到2017年和2018年神龍架構承擔雙11世界級的工程。“可以說通過這10年的發展,我們重構了整個計算的服務模式,也讓我們具備了服務全業務場景的能力”,張獻濤強調。

那麽下一個10年的雲計算長什麽樣呢?在過去的兩三年裡,阿里雲在不斷的問自己,也進行了相應的探索和嘗試。2019年9月,阿里雲發布了第三代神龍架構,通過第三代神龍架構全面提升了神龍雲伺服器的服務能力,自研的軟硬一體化架構能夠大幅度提升計算效率以及網絡和存儲服務能力。基於第三代神龍雲伺服器,構建了新一代ECS產品家族,包含了本次發布的第六代增強型實例、第七代高主頻實例、記憶體增強硬實例、新一代GPU實例、NPU實例、超級計算集群實例、全球首款持久性記憶體實例等等。

以第三代神龍雲伺服器為ECS帶來價值來看。ECS第六代增強型實例,由三部分組成:在計算方面自研了Dragonfly Hypervisor,而不再使用傳統的KVM、XEN等虛擬化架構,自研的輕量級Dragonfly Hypervisor不僅資源佔用少而且虛擬化效率提升明顯,計算抖動性方面可以達到百萬分之一級別;在存儲方面,第六代增強型實例全系標配ESSD雲盤,最新一代ESSD雲盤可達單盤100萬IOPS、單路延遲最低100微秒,極致性能極大提升了第六代增強型實例的存儲能力;在網絡方面,阿里雲自研神龍架構也帶來了超強的網絡IO能力,最強可提供單實例2400萬PPS轉發、每數據包最低延遲21us,處於業界絕對領先水準。

可以說第六代增強型實例是集大成者,不僅繼承了第三代神龍雲伺服器的優點,而且是自研軟體和硬體等多種因素之間巨大化學反應的成果。例如,ESSD單盤具備100萬的IOPS、吞吐達到每秒4GB、延遲達到100微秒級別、每一次快照備份可達5秒以內,而這樣的超強能力與第三代神龍雲伺服器結合之後,產生了巨大的化學反應。而在網絡方面,第六代增強實例單實例轉發可以達到2400萬PPS,當前業界最好水準在1000萬PPS;第六代增強型實例數據包延遲為21us,當前業界最好水準在30us以上;第六代增強型實例支持網卡密度方面,提供了超過100個ENI網絡接口,而當前業界最好水準最多不足20個。

除了這些單點性能對比,從端到端的性能對比來看:在MySQL場景中,第六代增強實例最高性能領先190%;在Nginx場景中最高領先86%;在Redis場景中最高領先103%。張獻濤強調,無論是計算、網絡、存儲的性能,還是端到端場景的綜合性能,阿里雲ECS第六代增強型實例與業界其它雲廠商相比,都具有很強的競爭力和優勢。

公有雲軟硬體的“化學反應”

從阿里雲ECS第六代增強實例“一騎絕塵”的效果,可以看出阿里雲對雲計算特別是公有雲未來十年的技術判斷:以公有雲的大規模運營和整體協同體系,反過來重構底層的軟體、硬體和應用,從而支撐更大規模的公有雲。簡單理解,就是讓公有雲體系中的軟體和硬體相互間發生“化學反應”,從而誕生新的“物種”。

在軟體方面,阿里雲整體展開了全面的雲原生化。毫無疑問,雲原生是當前和未來的雲計算標準化技術,特別2019年以來Kubernetes和容器為代表的雲原生技術“底座”已經取得了絕對的市場領導地位,相當於把“集裝箱”、“貨輪”和“碼頭”等工業標準化,奠定了雲計算未來十年甚至更長遠的技術標準體系。

阿里雲也對雲原生“All In”。從2011年邁進容器大門算起,阿里的雲原生之路也已經走了十年。過去幾年,阿里雲憑借業界最豐富的容器產品家族和容器服務,已經連續數年以超400%的規模高速增長。阿里雲在容器、服務網格和Serverless均有豐富的產品服務,擁有國內最豐富的雲原生產品家族、最全面的雲原生開源貢獻、最大規模的雲原生應用實踐、最大的雲原生客戶群體,產品體系覆蓋八大類別20余款產品,涵蓋底層基礎設施、數據智能、分布式應用等,可以滿足不同行業場景的需求。

在Gartner今年4月發布的2020年容器公有雲競爭格局報告,阿里雲再度成為國內唯一入選廠商。而在今年3月,Gartner第二次公開的《競爭格局:公共雲容器服務》年度調研報告,針對Serverless、Kubernetes、服務網格、容器鏡像等十項功能維度進行對比,阿里雲和AWS覆蓋九項產品能力,產品豐富度領先於其它廠商。

阿里雲的雲原生軟體能力,也配合了神龍伺服器等自研硬體的“化學反應”。例如第六代增強實例提供了超過100個ENI網絡接口,而一個實例的網卡數目增多可以極大提升容器性能;而彈性裸金屬實例加上容器技術,可以提供高於物理機的性能,即同樣規格的物理機對比運行容器和神龍裸金屬伺服器,性能會有20%-30%的差距;此外,彈性裸金屬實例還支持阿里雲安全容器,提升端到端安全隔離能力,與開源方案相比性能提升 30%,也支持阿里雲首發機密計算容器,基於軟硬一體技術有效保護數據隱私。

2019年阿里巴巴雙11就運行在神龍裸金屬伺服器上,性能提升了20%-30%,綜合成本的下降甚至超過了50%。本次疫情期間,容器+神龍裸金屬方案以超高性能支撐釘釘抗住有史以來最大的流量洪峰,以前釘釘100%部署在普通物理機上,疫情突發之後出現了政府、企業和學校對在線協作的需求猛增,通過雲上神龍裸金屬+容器彈性部署方案,快速地實現了釘釘業務應用10萬核擴容需求。

阿里雲智能總裁張建鋒近期曾表示,雲是一個新型計算體系結構,它從原來的PC時代、大機和小機,全面升級成雲的形式;雲的特點是分布式,雲在互聯網分布式基礎上更強調彈性,更強調大範圍調度、複用、安全性,這是雲本身很重要的特點。發展雲計算,就要一整套的雲系統。過去十年,阿里雲終於錘煉出了這套雲系統。未來十年,阿里雲將用這套雲系統,重構底層基礎硬體和軟體,從而支撐更大規模的阿里雲。(文/寧川)

獲得更多的PTT最新消息
按讚加入粉絲團