數據基礎設施的詠歎調：華為給大數據時代一個智能擁抱

玩過《文明》這類城市模擬遊戲，或者喜歡看工業主題小說的朋友會知道這樣一個概念：一座城市、一個地區想要發展起先進的工業文明，必須建立在足夠的基礎設施基礎上。

過去一百年的工業文明中，最重要的基礎設施往往是煤和鐵。所以國家和城市想要進入現代化，往往需要完善的煤鐵綜合體，工業理論上也有個說法叫做“煤鐵優先”。從基礎建設到萬物萌生，這個過程看似枯燥，卻隱隱吻合著自然生態的法則與歌詠。

光陰流轉，當我們來到信息革命的深水區、智能時代的前夜，是否依舊有“先基礎設施，再到萬物發芽”這樣的邏輯呢？在雲、數據和AI開始成為每一座城市、每一家企業，甚至每個家庭的必備品時，我們仔細審視一下這些技術的發展邏輯，可能會發現像電氣化時代的“煤鐵”一樣，今天這個時間節點的基礎設施，是數據庫與存儲。

這個邏輯當然很容易理解，當我們發現數據就像水電石油一樣是生產必備能源的時候，只有足夠負載能力的數據庫和存儲系統，才能讓數據這種新能源可以被切實儲備和調用。反過來，如果數據都存不住、調不出、查不到，那所有數據應用就都歸於妄談。

然而事實上，今天社會各行業普遍面臨著數據基建的挑戰。為迎接這些挑戰，數據基礎設施的行業升級也在不斷前行當中。

5月15日，華為數據庫與存儲新產品發布會上，GaussDB分布式數據庫和FusionStorage 8.0分布式存儲系統都進行了重磅新品發布。而它們背後的內涵，是華為正在為數據基建的未來，送上一個智能化的擁抱。

智能時代，政企面前的數據渦旋

讓我們先來簡單回顧一個問題：為什麽我們今天需要源源不斷地升級數據庫和產品？

最直接的原因在於，隨著雲計算、大數據技術不斷發展，企業的數字化程度不斷升高，企業存儲和需要利用的數據普遍處在單向增加周期。久而久之，一個數據組成的渦旋開始逼近每一個政企組織。

無論是企業網還是在線業務，每天都在為企業生產大量的結構化數據。這些數據需要被妥善存儲，反覆查詢、應用，並且不斷更新。由於結構化數據需要進行不斷關聯，這讓越來越多的企業開始應用能夠不斷擴展規模的分布式數據庫與分布式存儲。在電商、金融、製造業等大型企業當中，對分布式數據庫和存儲的需求尤其明顯。

而伴隨著原有數據量的不斷增長，今天企業還在普遍開展網絡化、智能化新業務，這讓新產生的數據關係越來越複雜，讓數據存儲和調用的難度不斷增大。大規模結構化數據的存儲和調用，一方面考驗著數據庫和存儲系統的可靠性，另一方面也在不斷增加企業的數據運維成本，加大人工運維的難度挑戰。

總體而論，這個邏輯就是數據在不斷增加，數據間的關係在不斷複雜，政企用戶應用數據的需求在不斷深化。三者疊加，導致政企用戶，尤其是某些高數據複用型行業，必須要擁抱“一大四高”型數據庫與存儲設備。

所謂一大四高，就是數據庫和存儲系統必須能夠支持大規模數據，同時高可靠、高安全、高擴展及高性能。

在智能時代，大規模結構化數據的爆炸式增長，就像一條怒吼而來的江河。它既是企業賴以生存發展的寶貴資源，卻也可能弄巧成拙變成洪水。於是，擺在大量政企面前的數據渦旋，開始倒逼數據庫和存儲必須進化。在分布式、高擴展的基礎上，這二者開始了一場新的進化路徑：智能化。

我們似乎可以把華為剛剛發布的數據庫與存儲新產品，分別看作是兩隻手臂。二者合圍，一個新的數據產業擁抱就此誕生。

左膀：GaussDB新品，繼續分布式數據庫的未來之旅

近幾年，數據庫領域的創新經歷了高速的發展，可供企業選擇的數據庫架構在不斷增多。而一般意義上而言，以金融行業為代表的、需要調用大規模結構化數據，且對擴展和安全性有極高要求的行業，正在普遍開始擁抱分布式數據庫。這一趨勢也在向越來越多的行業蔓延。

GaussDB，是華為創新領先的分布式數據庫產品。其最著名的特點，在於它是業界首款支持ARM的分布式數據庫。我們知道，近幾年ARM產業生態不斷發展，越來越多軟硬體選擇支持ARM處理器。對ARM芯片的兼容，已經悄然成為了數據庫產品的主要痛點之一。

而華為的GaussDB，利用ARM多核以及超並行計算技術，構築了軟硬體全棧的數據庫能力，完善了ARM產業生態。另一方面，面對越來越複雜的數據庫調用需求和智能時代大量任務需要異構計算的現實，GaussDB還可以利用 AI芯片、GPU 、ARM、NPU等多種算力組合，讓數據庫獲得強大的異構計算能力。在權威標準測試集TPC-DS上，性能比業界提升50%，排名第一。

在此基礎之上，為什麽說GaussDB是對智能時代的擁抱呢？原因在於其採用了華為獨創的AI-Native技術。這項技術的價值在於，華為將機器學習能力加入到了分布式數據庫的全生命周期當中。運用“自動駕駛網絡”，對數據庫進行具備主動學習和理解特徵的自我調優、自診斷自愈、自運維。

這個技術創新的核心價值，在於利用AI技術在多個層面的融入，解決了數據規模越來越大、結構越來越複雜之後，帶給用戶的運維難題。

當數據庫體量巨大之後，人工運維將是非常複雜，高消耗、低效率的一件事。而AI-Native的加入，則讓企業的運維成本呈現出指數級下降。

有數據顯示，在交易、分析和混合負載場景下，華為基於深度強化學習的自調優算法，能夠調優性能把業界平均提升60%以上。

這些產品的發布，極大豐富了GaussDB的產品形態，應對了全行業日益複雜的數據庫產品需求。

右臂：FusionStorage 8.0帶來極致存儲體驗

在數據爆發的今天，越來越多政企用戶開始抵達集中式存儲的瓶頸。結構化數據的不斷延展，導致企業隨時需要擴展存儲空間，同時保證存儲延展的可靠性和兼容性。

另一方面，大數據的規模化應用和智能化的加深，也導致用戶開始需要高效率的存儲體驗，以確保存儲無損和高效存入調出。

為此，FusionStorage 8.0通過重定義存儲架構，為用戶帶來了存儲體驗的新高度。

首先在核心性能上，FusionStorage 8.0採用華為ARM-based處理器鯤鵬920加速，使IOPS提升了20%，結合華為AI Fabric無損網絡，時延降低了15%。其在SPC-1的性能測試中，單節點性能達到了16.8萬IOPS以及1ms以內時延，能夠適應企業核心業務存儲的需求。

存儲產品的另一個痛點，在於多類存儲之間存在不可兼容性。一旦企業數據複雜化增加，就會讓存儲成本和工作複雜性極大提高。為此，FusionStorage 8.0打破了架構壁壘，創新實現一套系統同時支持塊、文件、對象、HDFS 協議，也就是說1套存儲能夠支持4類主要存儲能力，讓用戶的多場景業務統一存儲成為可能。

而與GaussDB一樣，FusionStorage新產品同樣加持了華為在AI技術方面的智能化能力。FusionStorage 8.0版本，通過雲上AI訓練和本地AI芯片的加持，將智能管理貫穿業務使用的全生命周期。

比如業務上線前對存儲資源進行智能規劃，使用過程中通過機器學習識別能力，對業務進行風險預判及故障定位等等，智能運維管理覆蓋業務全流程，從而得以整體性地大幅提升存儲效率。

高效能、跨結構和智能化，讓FusionStorage 8.0從多個維度開始追逐“極致存儲”的稱號。反過來看，我們可以發現華為存儲與數據庫產品挑戰新台階的過程，事實上也代表著數據產品的發展趨勢：用智能能力，擁抱智能時代。

用智能能力擁抱數據，用更好的數據產品擁抱智能時代

毫無疑問，未來是屬於智能時代的。AI為代表的智能技術將滲透入每一個企業與組織，在無數個角落生成生產力的進步。然而這個宏偉的時代，今天必須以數據產品的可靠、可用、安全為前提。

但是如何讓數據產品達到這些目標呢？在華為看來，這就需要智能技術的滲透，以及多種ICT技術的融合與突破創新。

從GaussDB和FusionStorage的發展軌跡來看，今天數據庫和存儲想要滿足新的產業需求，必須經歷三項面向智能時代的普遍升級。只有如此才能應對日益複雜的數據挑戰，為產業用戶從多方面消解迎面而來的“數據高壓”。

1、數據洪流面前的百渠能力。大數據時代，分布式數據存儲成為主流。分布式數據結構，從本質上來說就是將洶湧而來的數據洪水，分散到千百水渠中。以疏代堵，分壓數據洪流。而這一過程中，需要數據極簡不斷進化抗壓能力、數據吞吐能力以及安全性能。而這需要考驗存儲、計算、網絡、AI等多個技術領域的積累和實力，利用技術協同優勢打造數據產品的創新解決方案。比如在FusionStorage 8.0中，就集成了華為在計算、網絡和存儲多領域的芯片和算法積累。

2、智能落地，是減輕企業數據負擔的有效方式。在今天，數據的吞吐與儲存，正在變成一件異常複雜的工作。其中人力無法觸及的領域正在增加，而想要舒緩用戶在數據領域的成本，智能化就是必不可少的路徑。我們可以看到，智能化的自動駕駛網絡，正在從方方面面進入華為的ICT產品中。這條全新的賽道，正在決定數據基建在新產業周期中的成敗。

3、架構打通之路刻不容緩。數據領域的另一個命題，是異構計算和多類型存儲正在成為大量企業新的需求。而在智能化業務發展之際，這個需求只能是正向提升的。因此打通原本封閉的各計算與存儲架構，實現數據基礎設施的“一以貫之，化繁為簡”，也是這一領域的核心進化方向。

本著這三條路徑，華為在數據基建領域，用兩款智能化新產品作為手臂，給予數據產業以一個深情的擁抱。這個擁抱的含義或許在於，即使是最基本的數據基礎設施，在今天的產業革命面前，也可以是一首複雜精巧的詠歎調：發現需求，克服障礙，勇敢創新，這些音符布滿其中，讓每一項技術創新都充滿韻味。