每日最新頭條.有趣資訊

從圖數據平台入手,“費馬科技”未來要開發分布式數據庫

編輯 | 石亞瓊

根據Gartner的預計,全球非關係型數據庫(NoSQL)在2020~2022預計保持在30%左右高速增長,遠高於數據庫整體市場。圖數據庫作為非關係型數據庫的一種,在數據存儲、關聯上優勢明顯,是未來處理複雜數據關係的技術趨勢。今天要介紹的費馬科技就是一家專注於圖數據技術,為企業提供高性能圖數據存儲及分析平台的公司,擁有自主研發的兩大核心產品——圖數據平台(LightGraph)和圖計算平台(PandaGraph)。

首先我們先來簡單了解一下“圖”的發展史。

圖論起源於18世紀歐拉對哥尼斯堡七橋問題的研究,並經由眾多數學家乃至計算機科學家不遺余力的發展幫助人們解決了很多實際問題。如今,基於圖模型的數據分析方法已經應用在了互聯網的很多場景,例如社交網絡分析、網頁排序、社區發現,在計算化學、天體物理學、生物信息學等自然科學領域也有廣泛應用。

圖數據庫並非指存儲圖片的數據庫,而是以圖這種數據結構存儲和查詢數據。節點和關係是構成圖的兩要素,圖計算是將數據按照圖的方式建模,把各類數據關聯起來,將不同來源、不同類型的數據融合到同一個圖裡進行分析,得到原本獨立分析難以發現的結果。

圖數據庫的出現是互聯網時代信息爆炸和數據複雜化的結果。由於以Oracle為代表的傳統的關係型數據庫只能以二維表的形式表示關係,因此在處理複雜關係上效率較低,而與之相比的圖數據則更擅長處理複雜的關係網絡;此外,費馬團隊在圖數據技術上已經積累了十多年的技術經驗,掌握了大量研究成果,因此團隊希望將技術落地為應用來解決現實問題,這也是費馬進入圖數據庫市場的原因。

費馬圖數據平台

在產品性能上,費馬與競爭對手相比,技術優勢體現在:

圖數據平台(LightGraph):目前速度可達千萬頂點/秒,能夠實現10TB級外存存儲。擁有存儲、查詢,和簡單分析的功能。LightGraph在簡單任務的執行速度上遠高於Neo4j 及TigerGraph。

圖分析平台(PandaGraph):費馬圖分析平台的優勢在於速度快、省記憶體。在處理速度上,PandaGraph的速度是Spark 及 GraphX的300倍;在記憶體使用量上,PandaGraph比Graph X節省一個數量級(12倍)。

此外,費馬在圖計算及圖數據市場的競爭優勢還體現在團隊實力和市場空間兩方面:

公司表示:費馬在圖計算及圖數據領域投入了大量研發力量。目前公司共有員工16人,其中13人均為研發,核心團隊來自清華大學及知名通信設備商,公司每年研發成本佔總成本80%以上。

根據Gartner研究報告,2019~2022年,圖數據庫市場將會以每年100%的增長率增長;而在過去的2018年,圖數據庫市場大概是5億美元,到2022年保守估計至少80億美元。市場尚處於藍海。

在盈利模式上,費馬提供標準的軟體產品,採用相對通用的技術,因此不需要針對行業進行產品定製化。採購周期約為1年,主要依靠招投標的方式。

目前公司已服務7-8家大中型公司,平均客單價約百萬。其中約80%-90%來自金融領域,公司近期開發了工業領域客戶,未來也將開拓中小型客戶。公司早期以直銷作為主要獲客方式,目前正在開拓渠道。公司預計今年營收約幾百萬,明年可達兩千萬。主要增長點來自於圖數據庫,目前已與多家大型銀行在談合作。

儘管圖計算及圖數據擁有性能優勢及廣闊的市場空間,但要落地依然面臨技術及商業模式上的難點。

對於圖數據來說,圖數據要實現大規模應用,難點首先在技術上。因為圖數據的存儲和分析與傳統的關係數據庫不同,對數據規整性要求高,一旦數據規整性差,就會影響計算,且分析難度會隨著分析維度的增加而增加。

業務上,對於圖計算來說,圖計算對數據全面性要求高,因為會涉及到多個數據源,且數據源往往會分屬於多個系統,因此數據集成是個難題,這也是所有大數據平台面臨的問題。儘管圖數據庫產品可以在技術上保證工具的易用性,但總體來說還是需要協調分管不同系統的部門來配合工作,這要耗費極大的人力成本。

另外,目前市場上圖計算市場尚未打開,因為收費模式是個難點,主要在於難以對產品定價。由於客戶的使用頻率和重要性不完全成正比。例如,給網頁做排序計算會涉及到兆級別的網頁數據處理,按數據量收錢對於客戶來說費用太高;況且計算系統可能每天隻運算一兩次,這樣也很難按照機器台數收錢,另外計算機閑置也會造成高額的運維成本。

圖數據面臨的是全球的競爭,目前公司的競爭對手包括:

美國的TigerGraph (2012年成立,目前A輪);國內公司包括BAT,這些互聯網頭部公司會在內部針對自己的產品開發相應的圖數據庫,但這種圖數據庫的應用針對性較強,所以並不適用於市場上其他客戶。

費馬科技於2016 年 5 月獲得鋒瑞、青島泰屹、金沙江和臻雲基金等投資人種子投資,投後估值 8000 萬;2017 年 11 月獲得京東金融 pre A 輪投資,投後估值約 1.6 億。

公司表示,圖計算在應用領域上將從金融領域向工業、生產製造、互聯網領域擴展;圖數據目前行業上缺乏標準規範,公司目前正積極參與行業標準定製,希望能夠成為像傳統關係數據庫一樣的標準數據庫。目前費馬的圖數據庫可以支持百億級別的節點,適用於市場上絕大部分客戶,但在未來如果涉及到超大規模數據的話,可能需要分布式數據庫,公司目前也處於研發階段。

獲得更多的PTT最新消息
按讚加入粉絲團