每日最新頭條.有趣資訊

對話CTO〡聽神策數據CTO描繪數據分析行業的無限可能

「對話 CTO」是極客公園的一檔最新專欄,以技術人的視角聊聊研發管理者的發展和成長。

我們特別邀請到了 ONES 的創始人&CEO 王穎奇作為特邀訪談者。王穎奇曾參與金山軟體 WPS、金山毒霸等大型軟體的核心開發工作;2011 年創立了正點科技,旗下產品正點鬧鐘、正點日歷在全球用戶過億;2014 年,王穎奇在知名美元基金晨興資本任 EIR,並以個人身份參與十餘家公司的管理谘詢工作;2015 年,王穎奇創立 ONES,致力於提供企業級研發管理解決方案。

在國內仍然處於初級階段的大數據跑道上,創立三年的神策數據不斷受到資本的青睞。最開始,神策數據想做的就是私有化部署。「我們的定位不是做一款 SaaS 產品,而是為企業提供深度用戶行為分析的平台。」接受採訪的曹強如是說。

清華大學電腦碩士畢業的曹強最初供職於百度大數據部,後來擔任極路由的數據總監,再與其他三位合夥人一起創立神策數據,擔任神策數據 CTO 一職。起初客戶需要 iOS SDK,曹強就買書自學寫 iOS;隨著客戶越來越多,曹強就跟著銷售團隊一起見客戶……從做數據到做管理,曹強正在逐漸轉換人生的角色。

本期對話 CTO 請到了神策數據 CTO 曹強,關於數據分析行業未來還有怎樣的想象空間,曹強聊了聊他的看法。

機器能解決的,就不麻煩人了

穎奇:很高興神策的CTO曹強同學能接受我們的訪談。首先可以講一講神策在數據分析領域,從技術上面有沒有跟別的公司的一些差異?

曹強:差異還是挺大的吧,我覺得主要是幾個方面。第一點是技術細節,比如我們選擇的存儲跟查詢是不預聚合的,所有的數據來了都是一條條的存起來,然後做任何一個查詢的時候,都是從最細粒度的數據來查。這樣做的好處是查詢的能力靈活,我們的維度指標可以任意選擇,非常多的分析模型,比如漏鬥、精確的留存、歸因分析,如果通過預聚合的方式都是很難解決的。第二個好處是時效性,比如收到一條數據,我們基本能做到十秒之內它就能在查詢接口上體現出來。但不做任何的預聚合的挑戰是,對於查詢、存儲以及數據掃描能力有非常高的要求,這是我們整個後端研發團隊主要的突破點。

第二點是我們認為數據采集應該是從需求倒推,先看需要數據用在什麽地方,再決定采哪些數據,結合客戶的整體技術架構,決定用哪一種數據采集方案。所以我們有專門的數據采集團隊。我們發布了安卓全埋點采集白皮書,相當於貢獻出了七種安卓全埋點采集方案的源代碼。我們所有的數據采集的 SDK 和工具都是開源的,希望能促進整個行業的發展。

第三點是定位。我們不是傳統的 SaaS 公司,而是企業服務公司,有點類似 ONES。同時我們絕大部分的客戶都是做私有化部署的。

穎奇:其實ONES也是一樣。大量的中小型公司還是會用SaaS的輕量級部署;中大型之後的話,我們的大客戶都還是選擇私有化部署。

曹強:那我們這點還是挺像的。不過我們現在 80% 的客戶是私有化部署,20% 是做 SaaS,我們可能跟很多公司不一樣,我們最開始沒有 SaaS 版本。

最開始我們就想做私有化部署,有幾點考慮。第一點是幫助企業實現數據資產的積累。第二點是消除客戶安全隱私的顧慮。早期我們的客戶以創業公司為主,客戶對於安全隱私不是特別在意。後來做到了金融行業,他們都有很多的合規的要求,而我們從一開始就是做私有化部署的,所以現在在這一塊做的比較順利。

第三點還是定位。我們對自己定位不是一個 SaaS 產品,不僅僅是一個數據分析產品,而是一個 PaaS 平台。我們非常看重客戶是否能夠基於我們的產品和系統去做對數據的深度應用,能夠直接訪問到原始數據,直接利用我們的存儲和計算資源。我們搭了一個數據平台,客戶可以寫自己的 MapReduce、Spark。我們關心客戶的內部系統能不能跟我們的做對接,所以將自己定位成 PaaS 平台。

以前我們只有神策分析一個單一產品,今年我們發布產品矩陣,就相當於把神策分析裡面一些抽象的或者說一些公共的數據處理能力,從采集、傳輸、存儲到查詢給抽象到了底層,然後神策分析就變成了這個平台之上的一個應用。同時我們還有神策智能推薦、神策客景、神策標簽管理、神策自動化運營,它們是共用下面的平台提供的數據處理能力的。

穎奇:剛才您講到我們現在在服務幾百個客戶的私有化環境,那請問神策是怎麽樣來去監控或者說是維護、更新,來使得這些差不多大幾百個實例都能夠穩定運行呢?

曹強:首先系統本身的魯棒性和本身的可恢復性,或者說本身能夠持續的運行的能力肯定是要比較強。第二點是說,有點像以前 Google 的 Burg,或者說百度一些類似的系統。在客戶允許的情況下,我們會去監控這些系統的運行狀態,不會拿客戶的隱私,出了故障之後通過我們跟客戶協商的幾種不同的通道把這個故障給報出來。第三點是安裝部署。但是對我們來講,產品設計上早期就是只有私有化部署版本,對公有雲上面的各個組件沒依賴,再加上我們在這一塊又做了非常多的自動化的工具。這也代表了我們一個理念,能用機器和程式解決的問題就盡量不要讓人來參與。

穎奇:那神策現在真正做產品技術的團隊是不是一些做核心產品,還有一些可能是面向客戶的?

曹強:我們團隊不是這樣劃分的,我們沒有定製開發,所以我們的實施會比較輕,實施主要是負責整個環境的搭建部署、數據的接入、數據的校驗、產品的交付,更側重於怎麽樣幫助用戶用好這一塊。因為客戶有時候會對我們的技術特別好奇,研發會跟客戶溝通,同時研發也會兜底解決一些技術問題,但是整體上研發是專注於我們幾個產品本身,所以我們大概是分為產品、後端、前端等幾個團隊。

穎奇:那您覺得神策在團隊風格上有什麽特點呢?

曹強:從整個團隊來講,我們在技術上是很開放的。對於銷售的要求也都是能講技術實現,能演示產品。同時,跟銷售配合打單的不是產品,我們是有技術售前跟業務售前。業務售前更多的是更詳細的來給客戶傳達我們的產品價值,具體在哪些方面能得到怎麽樣的一個價值,能發揮它的作用,怎樣提升效率,怎樣節省成本等等。

技術售前都是技術上非常全面的人,我們的技術售前的職責包括 POC,他們是要直接乾活,他們直接要去登機器,去安裝去部署,有問題去查日誌,去查記錄,去寫 SQL,然後去做類似於寫一些工具來導數據等等。

從寫代碼到做管理是一種強烈轉換

穎奇:接下來可以講下您個人的履歷。

曹強:08 年剛去百度的時候是在百度知道團隊做個性化推薦、做檢索,然後就跟文鋒、力力、耀洲,就我們四個神策創始人,慢慢的就變成到一個團隊,先做百度日誌平台,再做用戶行為分析。後來又做了 UDW,就是用戶數據倉庫;做了 User profile,就是用戶畫像;做了 ID-Mapping 的相關的一些工作。14 年 4 月份我離職去了極路由,做技術總監。15 年就我們一起創業做神策。

穎奇:那聽起來的話就是一直是在做數據相關的。

曹強:對,一直是在做數據,並且我之前一直是做技術不是做管理的。在極路由雖然叫技術總監,但也還是自己寫代碼。一年以前我還在寫代碼,但是現在沒有時間(寫代碼)了。

穎奇:大概花了幾年時間去做一個這麽強烈的轉換,大概兩年半的時間?

曹強:對,我覺得這個還在轉換過程中吧。我一開始在神策負責 DataLoader,其實就是數據導入。後來我又去學寫 iOS,跟另一位做機器學習的同事參考國外開源的 SDK 分別做 iOS 和安卓。隨著接入更多客戶,我就承擔了相當一部分的售前工作。後來團隊從只有研發逐漸的擴展,運維、技術支持、售前,再到項目經理、實施工程師。團隊的組建不是有意識的招人,而是跟著需求來。人越來越多,逐漸沒有辦法把精力放到寫代碼上,自然而然地就不再寫了。

更大的需求在產業更深處

穎奇:那我們講講您對整個數據分析這個行業未來的一些看法吧,關於這個行業將來會怎麽發展?它在整個大行業裡會產生一個什麽樣的效果?

曹強:數據分析,或者說我們做的用戶行為分析這個行業,過去三年我們也趕上了好時候。一方面是行業競爭激烈,客觀上需求在增長;另一方麵包括我們一些友商在內,很努力的去教育市場。從互聯網行業向外發散,非互聯網行業,像銀行、券商、航司,他們都對這個概念是有意識的,精細化運營、數據驅動、增長黑客他們都覺得很好,所以我們是碰上了一個好時候,用戶行為分析理念會越來越深入人心。這是第一點。第二點是落地的要求也會越來越高。對於互聯網行業,只要提供一個好用的工具,工具做的效率很高就能用起來。傳統行業雖然也有意識,但是幫助他們來落地,工具再好用都不夠。這就是我們的服務越來越重的一個原因,所以落地也會越來越難。

例如《跨越鴻溝》的理念,一開始只有小部分人最願意嘗鮮,思維最活躍的那部分人用,你的服務會很輕。現在我們正在慢慢地跨越鴻溝,從早期嘗鮮者到早期大眾,但是早期大眾用這個東西可能就需要我們提供更多的東西,不僅僅是一個工具,還需要好的方案、案例,別人怎麽用的,同行怎麽用的,互聯網公司怎麽用的,這些事情要求越來越高。

穎奇:那我能這麽理解嗎,您認為整個的數據分析行業將來是會比你們在最早期創業的時候想象的空間還要大。

曹強:要大很多倍,我們早期認為只有互聯網公司才會用我們的產品。現在我們總結就是,如果對方有一個線上的服務,不管是 APP 還是網頁還是小程式,只要對方所在行業有充分的競爭,甚至像 CCTV、人民日報,這些都是我們的客戶,最早很難想到。

穎奇:其實這個跟我們現在做ONES這個產品是很像的。早年我們認為可能客戶都是做APP的、做研發的,但是現在包括你剛剛說的人民日報,他們也有來採購我們了。

曹強:對,這個從釘釘就能看出來,他們也覆蓋了很多偏傳統的一些企業。我覺得這是一個很好的事情,因為客觀上我們是幫助整個社會、整個大的行業提升數據的使用效率,我們企業的願景就是往這一塊。

穎奇:ONES實際上也會講到願景,我們的願景是幫助客戶更好更快地發布產品。我們也可以來聊聊神策的願景。

曹強:神策的願景是重構中國互聯網數據根基。我們最早主打的神策分析這個產品,客戶肯定會用得服務越來越深,會越來越到傳統的行業裡面去。但是從另一個方面來講,這裡還有一些新的需求。客戶花這麽大的代價采集了這些用戶行為的數據,僅僅做分析,雖然分析能解決很多問題,但是也隻發揮了 30% 的價值,剩下 70% 的價值,我們就有一些其他的產品。

穎奇:就要考慮要怎麽用它,才能夠真正推進業務增長。

曹強:我們非常多的媒體、電商類客戶有個性化推薦需求。零售、券商、航司客戶有精細化、自動化、高效率運營高價值用戶的需求,所以我們的自動化運營產品可以解決這些問題。「神策客景」則主要是解決像我們一類 SaaS 公司的需求,他們都面臨客戶續約的問題。所以我們還是用那一類數據,但是從不同的場景上來做了新的一些產品出來。

穎奇:就是從收數據、分析數據、看數據到用數據,真正的把這個數據用起來。我還想問一下,您最近有沒有看一些覺得已經影響到您工作、管理或者技術上的書。

曹強:我今年一共讀了 74 本書,最近在看《重新定義公司:谷歌如何工作》,有幾個觀點我特別認可,例如 Google 的招聘觀念是與其花那麽大的代價招 50% 水準的人,然後花大代價去培養他們,希望他們能表現到 90% 的水準,還不如一開始就花大代價去招 90% 水準的人。還有薛兆豐的《經濟學講義》,也有一些很好的觀點。平時我也會做書評、讀書筆記,會把書裡好的部分記錄下來。

穎奇:好的,今天有很多收獲。非常感謝您的分享。

本文作者:王穎奇

聯繫方式:[email protected]

獲得更多的PTT最新消息
按讚加入粉絲團