每日最新頭條.有趣資訊

你不知道的數據讀心術

內容來源:大數據與人類文明的融合,是我們不可避免的未來。本文為中信出版集團書籍《數文明:大數據如何重塑人類文明、商業形態和個人世界》讀書筆記,筆記俠經授權發布。

作者簡介:塗子沛,大數據先鋒思想家、阿里巴巴前副總裁,出版書籍《大數據》、《數據之巔》。

封面設計&責編| 浮燈

第2576篇深度好文:5895字 | 10 分鐘閱讀

讀書筆記·數據思維

本文優質度:★★★★★口感:脆柿子

筆記君說:

從互聯網、物聯網到數聯網,大數據催生的商業應用在不斷迭代。

從人工智能、城市大腦到單粒度治理,大數據推動國家治理現代化。

“數文明”是理解過去和現在的一條捷徑,是連接歷史與未來的文明“金錢”。面對我們這個時代的數據浪潮,你做好準備了嗎?

文末有驚喜~

一、數據讀心術,被“操控的選舉”

2018年3月,全球最大的社交網站Facebook被曝出負面新聞:

一個名不見經傳的小公司,通過不正當的手段,在Facebook網站上獲取了8700 萬用戶的數據。

這些數據隨後被用於多個國家選舉中的選民分析,2016年當選的美國總統川普就曾經雇用這家公司,這引發了關於數據操縱選舉的批評,直逼川普當選的合法性,觸目驚心。

在選舉中大量使用數據的做法,起源於美國第44任總統奧巴馬。

2008年,他第一次代表民主黨參選期間,建立了專門的個人競選網站,收集了1300萬人的個人資訊和郵箱地址。

在此之前,大規模的行銷和宣傳活動一般使用“資訊群發”的方式,但奧巴馬放棄了這種方式。他雇用了一批數據科學家,嘗試通過數據對選民進行分類,向不同類別的選民推送不一樣的定製資訊。

到2012年,奧巴馬競選連任,這時候Facebook已經聚集了8億用戶,奧巴馬的個人競選網站實現了和Facebook聯動。

這兩屆總統選舉都以民主黨大獲全勝告終,奧巴馬使用的大數據分析方法也成為教科書級別的經典案例。在此之後,共和黨痛定思痛,決心迎頭趕上。

個別共和黨“大佬”開始和技術極客交朋友,出資參與他們成立的數據公司,其中有一家就是Facebook風波的主角劍橋分析公司,它於2014年成立。

這家公司之所以叫劍橋分析,和它的團隊和數據來源有關。

劍橋大學心理系有一名年輕的研究員科根以學術研究的名義在Facebook上推出了一個小小的程式,它宣稱可以免費提供性格測試,參與者還可以得到一個5美元左右的現金紅包。

這也是今天一個奇怪的現象,一毛錢掉在地上,很多人都懶得彎腰去撿,但對互聯網上的一毛錢,大眾趨之若鶩,搶得不亦樂乎,最終32萬人參與了科根的調查。

是時候揭下互聯網的“免費”外衣了:

幾乎所有的互聯網服務都是免費的,但使用者其實付出了對價,我們交出了“數據”。

32萬人如何突變成8700萬人呢?

這是因為Facebook精心設定的“缺省”隱私政策,即如果用戶沒有特別表態,他的個人資訊就對他所有的朋友開放。

放到科根爬蟲的工作場景中,這意味著除非一個人的朋友已經特別聲明自己不願分享資訊,否則科根的爬蟲在扒取某人資訊的同時,也可以把他朋友的資訊一並扒取。

於是,雖然參與科根測試的用戶只有區區32萬,但憑借缺省許可,這些“種子”最終開枝散葉,科根裂變式地收集到了8700萬用戶的資訊。

科根之後轉手,8700萬人的數據在雲端悄無聲息地歸到了劍橋分析公司的名下。

出乎人們意料的是,劍橋分析公司用這些看似不起眼的公開數據,玩出了大花樣。

他們把8700萬人的社交數據和美國商業市場上2.2億人的消費數據進行匹配、組合和串聯,找出誰是誰。

然後就性別、年齡、興趣愛好、性格特點、職業專長、政治立場、觀點傾向等上百個維度給選民一一打上標簽,進行心理畫像,建立心理檔案。

再通過這些心理檔案開展分析,總結出不同人群的希望點、恐懼點、共鳴點、興奮點、煽情點以及“心魔”所在。

當代大數據“讀心術”就此誕生了。

掌握了一個人的“心魔”,就可以評估一個人最容易受哪種資訊的影響,就可以知道資訊該如何包裝、如何推送,才能搔到接收者的癢處,潛移默化地影響一個人的選擇和判斷。

相同的配方,熟悉的味道。

這些精準投放的宣傳資料,就好像一顆顆用數據調配的藥丸,被推送給選民反覆服用,之後慢慢地發生作用,最終引導選民做出藥丸配製方預設的政治行動。

大數據不僅僅是科學,還是技術,它是科學和技術的混合體。

在劍橋分析公司的主頁上,這個公司號稱服務過世界五大洲100多場選舉,其中還包括2016年英國的脫歐公投。

這是2016年度全球最大的“黑天鵝事件”。

脫歐派以52%-48%的微弱優勢最終勝出,全世界為之感到意外。

雖然“數據藥丸”對選舉的作用大小很難量化,但有一點可以肯定:

在一場勢均力敵的、差距很小的選舉中,它會起到關鍵的作用。

在Facebook最後的道歉聲明中,公司並不承認這是一場“數據失竊”事故,而是強調“沒有保護好用戶的數據”。

事實上,這起風波連“泄露”都談不上,因為“點讚”數據幾乎是公開的,數據在整個過程中都是經過用戶同意才被扒取的。如果真要說這是隱私侵犯,也是合理侵犯,但真正的問題卻比隱私侵犯還要嚴重。

真正的問題在於,即使通過公開的數據,互聯網也可以成為影響、操縱、控制他人心理和觀點的媒介工具。

這不是隱私侵犯,而是心理入侵、思想入侵、意識入侵。

Facebook風波發生在美國,無獨有偶,2018年初,中國的大數據公司也被曝出了一系列的負面新聞。

它們的問題既不是傳統的隱私問題,也不同於劍橋分析公司的“數據藥丸”和意識操縱,它們侵犯了消費者的錢袋子。

2017年12月,一名中國網友在微博上講述了自己遭遇大數據“宰客”的經歷。

他經常通過某旅行網站預訂某酒店的房間,價格常年為380~400元。偶然一次,酒店前台告訴他淡季價格為300元上下。他用朋友的账號查詢後發現,果然是300元,但用自己的账號去查,還是380元。

這條微博引發了網上的“大吐槽”,媒體打出了“大數據殺熟”的標題。

所謂“熟”,就是通過消費者的數據掌握了消費者的底細。

據中國電子商務研究中心的不完全統計,包括滴滴出行、攜程、飛豬、京東、美團、淘票票在內的多家互聯網平台均被曝光存有“殺熟”的情況,特別是在線差旅平台更為嚴重。

對此,各家平台反應不一,有些聲明“堅決沒有”,有些不予回應,還有的“委婉默認”。

“殺熟”的淵源可以追溯到5年前開始興起的“千人千面”。當然,“千人千面”的實現基礎就是“數據識人”。

“千人千面”的硬體基礎是移動互聯帶來的“一人一屏”。

如果幾個人共用一部手機,算法的準確性就無從談起,但就是因為“一人一屏”,一個新的可能出現了,價格也可以變得個性化—千人千價。

簡單地說,就是通過數據可以區分窮人和富人、新人和舊人、價格敏感人群和價格不敏感人群、蘋果手機用戶和安卓手機用戶。

“一人一屏”和“數據識人”深刻地改變了商家和消費者的關係。

在傳統的商超,價格一經公開,所有的消費者都享受一樣的價格,如果價格不合理,商家會受到眾人的挑戰,商家和消費者是一對多的關係,因為眾怒難犯,商家不敢輕易打歪主意。

但在“一人一屏”的時代,商家和消費者變成了一對一的關係,價格是隱秘的、單行的,價格合不合理,消費者只能靠自己判斷,而消費者的認知太空已經被手機和數據割裂了。

二、數據驅動,新文明的興起

隨著大數據的興起,“言必稱數據”逐漸成了我們這個時代一個顯著的特徵,但問題是,此數據非彼數據。

今天,所有“記錄”的結果,甚至包括文字,都被統稱為數據。

這其中暗含的邏輯是:

數據作為一個概念,它的內涵擴大了。

傳統意義上的數據是人類對事物進行測量的結果,是作為“量”而存在的數據,可以稱為“量數”。

今天的照片、影片、音頻不是源於測量而是源於對周圍環境的記錄,是作為一種證據、根據而存在的,可以稱為“據數”。

幾乎人類的一切行為,今天都可能、可以被記錄,並被轉化為據數。

如果說量數的核心要義是“精確”,那據數的關鍵就在於“清晰”地留據。

因為智能手機的普及,據數已經無處不在。

迄今為止,以據數為中心的大數據討論主要停留在以下三個層面。

一是精準行銷,即互聯網廣告業。

和傳統的廣告業相比,今天的互聯網和智能手機通過記錄消費者不斷產生的數據,可以向終端用戶推送個性化的廣告,這大大提高了行業效率。

這是大數據革命在商業領域的起源。

這也是目前互聯網企業,無論是中國的 BAT(百度、阿里巴巴、騰訊),還是美國的谷歌、Facebook、亞馬遜最主要的贏利途徑。

二是商業和社會信用,其主體是金融機構。

除了精準行銷,這是利用大數據賺錢的第二個法門,也是我們看到諸多互聯網企業陸續進入金融領域的原因。

其商業模式是,通過消費者的消費記錄評估消費者的信用,從後續的金融服務中贏利。

例如阿里巴巴旗下的“芝麻信用”和騰訊旗下的“微粒貸”,它們在給消費者打“信用分”的基礎上,向單個消費者提供貸款等金融服務。

這兩種商業模式,都需要通過數據監控消費者在互聯網上的一舉一動,消費者個體因此成為被觀察、被分析、被監測的對象。

這就帶出了第三個層面的問題——隱私。

這兩種商業模式的副作用是,我們幾乎每天都能聽到數據泄露的新聞,時不時還會看到因為它而導致的悲劇。

這就是大眾眼中的大數據,前兩者為商業利潤而生,而隱私問題屢屢成為社會公共話題。

可是,這三個層面僅僅揭開了冰山的一角,難道大數據就是養了幾家大公司,方便了公眾生活,改善了信用評級體系,讓生活更美好或者多了點麻煩這麽簡單?

遠不止於此。

在商業層面,大數據還在進一步深化變革,它所催生的互聯網應用仍在不斷更新迭代。

當大數據完全發揮出它的潛力時,其最終形態將是全自動商業,或稱智能商業,商業文明將會被重塑和再造。

據數的商業化應用帶動了大數據的興起,但商業只是故事的一個邊角。

革命是社會化的,未來我們還會看到智能製造業,它所依靠的還是數據。

數據引發的變化還在向社會治理和個人生活領域全面拓進,它涉及社會生活的方方面面,將會推動整個社會進入文明新狀態,改變社會的全貌,被稱之為“數文明”。

三、數文明,社會和個人如何被賦能?

在國家和社會的層面之上,我們將會看到更大的變化。

越來越多的個人行為在被記錄,對國家而言,這意味著每一個國民個體、每一輛車甚至每一個其他物體都可以被追蹤。

如果懂得使用數據,那麽站在官僚層級的金字塔上,我們的社會將呈現出一種現在就非常清晰而且會越來越清晰的狀態。

據數就是這個高清社會的紋理,清晰性是有效治理的前提。

和量數相比,據數為國家治理提供了新的工具和手段。就此而言,用好大數據是通向國家治理現代化的最佳路徑。

今天中國要建設法治社會已經是共識,《數文明》要提出的是數治。

數治就是憑借對數據的有效收集、處理數文明和分析來治理國家以及與之對應的數據治理。

數據治理將是國家治理的重要內容。

對國家而言,以大數據為結果的互聯網代表的是新生的力量,它正在重塑傳統社會,數治正在有效地解決人類對安全的根本性需要。

另一方面,大數據、互聯網又帶來挑戰。

國家力量已經不可能完全左右互聯網連接起來的有機社會了,相反,越來越多的公共功能在向私人公司、社會機構轉移。

如何利用這股力量,又約束住這股力量?

這股力量可能會重塑整個社會的結構,催生新的政治文明,數治因此是一個具有挑戰性的話題。

數文明不僅和國家、社會相關,也直接關係到個人。

對個人來說,掌握未來發展、演進的方向,知道哪些行業將消失,哪些行業又將興起,這當然非常重要。一個在黑夜中行走的人是走不快、走不遠的,他也無法領略到沿途的風景之美。

在數文明的時代,通過記錄賦能,個人會成為高能個體,一個具備數據意識、數據頭腦和數據技能的數據公民當然更容易獲得成功。

新的時代會改變個人的命運,我們也應該調整我們的價值觀。

個人的成功和一個民族的文明自有相通之處,這個相通之處就是記錄。

因為普適記錄,個人更容易獲得成功,而推動文明發展的最終動力則是無數國民源源不斷的創新。

正因如此,數文明的能量和潛力有可能超越歷史上所有的文明。

四、新文明的悖論,一類新的隱私觀

當然,新文明本身也問題纏身。

當我們撥開大數據表面上的浮雲,立刻就可以看到一個商業逐利和社會控制的世界。

個人向互聯網企業讓渡的數據反過來為互聯網企業的“殺熟”行為提供了便利。

無數人的個人生活被圈在一個固定的小天地裡,看個性化推薦的新聞,閱讀個性化定製的消費指南,他們感覺很舒服。事實上,我們出讓的數據正在成為我們的電子腳鐐和枷鎖。

這是新文明的兩個悖論。

一方面,數據越清晰、越全面、越真實,就越有利於個性化生產,避免資源浪費,比如精準行銷、個性化頁面、私人定製服務;另一方面,數據又帶來了資訊繭房、資訊窄化的風險。

一方面,大數據要求更加開放甚至是無限制的聯接,另一方面這又將傷害個人的隱私和權利。

那該如何看待新文明的問題?

文明從來都是在衝突中成長的,沒有哪種文明一開始就很完美。今天資訊技術的發展提供了新的可能,但數文明最終的形態是需要大家一起創造的。

事實上,上述悖論也可能很快被破解。

比如,通證經濟來臨,區塊鏈技術正日臻完善,未來一個人的數據很可能並不保存在 Facebook、阿里巴巴、騰訊這些大型互聯網公司,而是保存在一個公共的區塊鏈上,這些企業使用我們的數據都必須經過我們的同意,被區塊鏈記錄。

我們目前所見證的數據革命,還遠遠沒有結束,如果真要說結束,那也只是一個序曲的結束。

即使是隱私問題,隨著人工智能的普及,它也在出現新的態勢,我認為整個人類,無論東方或西方,亟須建立一種新的隱私觀。

例如,被中國大眾頻繁詬病的“大數據殺熟”和“千人千價”,它們是通過算法對數據的自動處理實現的,主觀上它沒有泄露任何人的數據。

可是處理這些資訊的並不是某個具體的人,而是算法和機器,它們自動運行,自行匹配,人為乾預的程度很低。

那麽,這種情況該不該簡單地被認定為侵犯個人隱私呢?

這就是新的情況:

你的數據都是算法和機器在處理,並沒有被泄露給“人”,在一定程度上,你的隱私並沒有受到“人為”的侵犯。

人為泄露個人數據的案例和情況當然還會出現,但我相信會越來越少。

我們的數據需不需要對算法和機器保密?這才是一個新的問題。

我們不會介意自然環境在注視或監視我們,那我們是否介意算法和機器注視著我們?或者說,我們應該介意嗎?

未來,算法和機器就是我們生活環境的一部分,讓機器了解我們,向機器開放我們的數據,這恐怕是通向智能時代、機器人時代、人機協同時代唯一的選擇。

人類新的隱私觀,其核心是要為商業和公共領域的算法劃定一個使用個人數據的邊界。

數文明的發展和延續,我相信是以百年、千年的時間為部門的,探討數文明,就是思考人類的百年大計、千年大計。

不管是國家還是個人,我們需要跟上新文明的演進步伐,否則就可能被新文明所淘汰。

福利俠來啦~

感謝俠客朋友們一直以來的陪伴、點讚,和加雞腿。

每當看到“從這裡獲得很多知識,大愛筆記俠……”這樣的留言,都會感到超級幸福。

那麽,筆記俠粉絲重磅福利來了:

我們將選出3個留言最走心、

並且也最受用戶歡迎(點讚多~)的用戶,

送出《數文明》各一本

評論放出、讚數統計截止至10月10日12:00

快來分享吧!

筆記俠新課推薦:

《馮衛東·更新定位24講》

聽聽學過的人怎麽說~

看完了,給筆記俠點個讚再走呀↓↓

獲得更多的PTT最新消息
按讚加入粉絲團