每日最新頭條.有趣資訊

算法當道,未來地圖中"假新聞"的鍋應由誰來背?

2016年美國大選結束之後,Facebook成為眾矢之的,輿論認為推送算法在假新聞的傳播問題上難辭其咎。“假新聞”一詞更是更為當年的年度熱詞,成為人們熱議的對象,吃瓜群眾恍然驚覺,自己信以為真、熱議傳播的驚悚消息不過是有人精心炮製的彌天謊言。

那麽在這個消息爆炸的時代,每日充斥社交媒體的諸多熱點新聞中,有多少是基於事實的客觀真相,又有多少是別有用心的輿論引導?“假新聞”的鍋應該由誰來背?是千夫所指的媒體算法,還是熱衷八卦的吃瓜群眾?如何從紛紜雜遝的虛假資訊中辨明真相?

本期全媒派(ID:quanmeipai)受權轉載影響力讀者俱樂部的書評,來看蒂姆·奧萊利在《未來地圖》中如何為我們指明假新聞的應對之道。

算法時代的媒體

在2016年美國總統大選結束之後,外界批評聲不斷,Facebook也成了口誅筆伐的重點對象。輿論認為,Facebook的新聞推送算法在散播錯誤資訊、擴大民眾兩極分化方面難辭其咎。

假消息號稱,教皇方濟各為唐納德·川普背書,妄言邁克·彭斯曾稱米歇爾·奧巴馬是“有史以來最粗俗的第一夫人 ”,還謊稱希拉裡·克林頓將被起訴,這些不實傳聞被轉發了一百多萬次。

而以上這些假消息,均是由一群馬其頓少年為掙錢而編造的。而“FBI官員身亡被偽造成自殺,或與希拉裡郵件門有關 ”——這個徹頭徹尾的謊言被轉發了 50萬次。這則謠言的始作俑者是南加州一名男子,該男子為了證明傳播虛假資訊輕而易舉,從 2013年開始散布假消息,最終竟創立了一家有 25名員工的公司,專職負責炮製謠言。

以訛傳訛的不僅僅是 Facebook的用戶。許多假新聞還通過郵件、推特、 YouTube、紅迪網和 4chan等管道流傳。當谷歌用戶開始輸入查詢關鍵詞時,谷歌建議的下拉框也會顯示這些偽新聞標題。

後真相時代的“過濾氣泡”

但 Facebook成為眾矢之的,或許是因為馬克·祖克柏一開始就對假新聞泛濫問題矢口否認。

在總統大選結束幾天后舉行的技術經濟大會上,祖克柏在台上接受採訪時說,有人認為一些不實傳聞左右了大選結果,“這種想法太瘋狂 ”。他辯解說,那些假新聞只是網站內容的滄海一粟。

假新聞是八卦小報的雕蟲小技,處於新聞業邊緣,曾遭人不齒,但如今何以在塑造我們共同的未來中發揮了如此重大的作用?

至少有一點, 2016年的美國總統大選把政治活動家伊萊·帕裡澤所稱的“過濾氣泡 ”體現得淋漓盡致。由點讚驅動的社交媒體算法為每個人定製更多他們感興趣的資訊,肯定他們的偏見,強化他們的信念,鼓勵他們在網上結交與自己志同道合的人。

華爾街日報創建了一個令人大開眼界的網站,叫藍色推送 /紅色推送,該網站使用Facebook對用戶政治立場的研究數據,並排比較兩黨派支持者收到的同一事件的不同推送新聞。推送給“極端自由主義 ”和“極端保守主義 ”讀者的新聞差異之大,讓人瞠目結舌。

我們生活在不同的世界裡。或許我們只是生活在新的“後真相”世界中,在這個世界,煽動情緒比展示事實更有分量。

社交媒體影響巨大

媒體傳播和媒體創造中的民主化,發揮了舉足輕重的作用。

皮尤研究中心的調查顯示, 66%的美國人通過社交媒體獲取新聞,這其中又有 44%隻通過 Facebook閱讀新聞。許多內容來自於傳統媒體,通過鏈接在社交媒體上分享。

也有許多是社交平台的原創,還有些來自於新興的、為黨派極度擁護者量身定做的網站,例如馬其頓少年為牟利而建的網站,或是極右或極左政治組織為支持所在黨派而建的網站。

更別說還有 ISIS這種組織,曾成功利用社交媒體招募恐怖主義分子。一位不願透露姓名的美國政府官員告訴蒂姆·奧萊利:“這並非我們的首場網絡戰役,我們剛打過,且已輸掉。”

用算法來玩打地鼠遊戲

從很多方面來看,虛假新聞甚囂塵上,提醒我們,如果算法有誤,如果數字燈神給出的指令設計有問題,就有可能引發災難性後果。儘管 Facebook和谷歌在本書出版之時肯定已進行了多次迭代來解決假新聞的問題,但是這一問題仍值得深入研究。

平台聲稱“中立”

在否認假新聞造成極壞影響的一周後,馬克·祖克柏承認假新聞是個問題,並表示 Facebook正在著手解決。他建議的方法是賦予“社區”更多工具,標記出那些他們認為真實或虛假的消息。

祖克柏希望把Facebook定位為一個中立平台,用戶可以通過這個平台與他人建立聯繫。

Facebook相信,控制假新聞散布應該由用戶負責,而不是平台。這種理念決定了 Facebook應對危機的方式。

祖克柏寫道:“我們已經啟動了相關工作,讓社區用戶對惡作劇和假新聞加標記,當然我們能做的還有更多。我們已取得階段性成績,並將繼續改進。”目前一切順利。他繼續主張讓 Facebook用戶承擔起督查網站的工作。

關於防範假新聞這件事,Facebook和谷歌等平台的內部討論圍繞的不只是如何謹慎處置才能避免誤判。他們更擔心自己的行為成為法律上的先例。

1998年施行的美國《千禧年數字版權法》,免除了互聯網服務提供商和其他在線中介在版權侵犯中的法律責任,理由是:他們屬於中立平台,用戶可以把任何內容上傳到平台上。平台更像是供用戶貼宣傳單的一面牆,不像出版商那樣必須事先甄選要出版的內容,以滿足更高的法律標準。

這種“中立平台 ”的說法,是互聯網服務存在的核心。若中立性缺失,那麽,每當谷歌把用戶發布的內容納入搜索目錄,它就要對用戶的任何版權侵犯行為負責。同樣,如果用戶發布侵權內容到 Facebook、推特、YouTube或者 WordPress部落格上,這些公司也將擔負法律責任。

類似的法律規定,可以延伸到適用於用戶發布的其他類型的內容。公司為用戶提供的是平台服務,而非內容。沒有哪家在線服務公司希望打破這層保護。

批評人士對這種辯護異常憤怒。英國作家卡羅爾·卡德瓦拉德就是其中一位,她對谷歌建議功能極為不滿,因為當她輸入“猶太人是……”的時候,系統自動補全的是“猶太人是惡魔 ”這樣的句子;

當她點擊搜索,她發現第一條搜索結果的標題是:“猶太人遭憎恨的十大原因 ”。來自新納粹網站 Stormfront的一個網頁排在第 3位,解釋為什麽猶太人是惡魔的內容出現在第 5、第 6、第 7和第 10條搜索結果;

當她搜索“是否有大屠……”谷歌為她自動補全的查詢是“是否有大屠殺這件事 ”,然後她被帶到一長串否認大屠殺的網站,置頂的仍然是Stormfront的網頁。

她給出的解決方案是:立即停止顯示這些網頁的鏈接。“在谷歌的商業模式背後是這樣一套說法:魔法般的算法揮動著它的魔杖,釋放出神奇的效果,完全不受任何人的乾預,”她在英國衛報的專欄評論中措辭嚴厲地批評道,“谷歌竭力避免被看成是媒體公司、內容提供商、新聞資訊媒介,因為那意味著它應該和其他媒體一樣接受共守的規則。但是谷歌就是媒體。”

但是,卡德瓦拉德忽視了谷歌運作的規模,龐大的規模從根本上決定了解決問題的必要方式。

平台的龐大規模

谷歌、Facebook、推特和其他類似的公司必須被視為新鮮事物,不屬於舊版圖的範疇。新事物有不同的運行規則,對內容的投入並非取決於某個人的好惡,而是出於必要性。

谷歌每次生成的搜索結果背後,都是海量的工作,需要對萬維網上每一個網頁進行檢索排序——根據谷歌前任搜索副總裁阿密特·辛格爾所說,包括來自 2500億個獨立域名的 30兆個網頁。谷歌每天要用這些數據來響應 50億次的搜索。

許多搜索關鍵詞是常見的,但是至少有上千萬的搜索是一些相當不常見的詞語組合。據谷歌所說,卡德瓦拉德抱怨的“大屠殺”搜索,每天僅有 300次的查詢。在每天 50億次的查詢中,這個詞的搜索僅佔日搜索量的 0.000006%,即幾百萬分之一。

Facebook的體量也同樣龐大。

2013年的社交網絡數據顯示,每天有將近 50億篇內容在 Facebook發布,目前的數字肯定遠比這大得多,因為網站的活躍用戶已從2013年的 7億增長到如今的10億。有人認為,谷歌和 Facebook只要招聘一些編輯、事實核證員或者使用外部媒體機構,就能輕鬆打擊假新聞、仇恨言論或者其他令人反感的搜索結果,把它們在搜索中逐個刪除或者降級。

這種想法表明:人們對這個問題的規模或性質一無所知。這就像是嘉年華遊樂場中打地鼠的遊戲,但是網上有幾十億隻地鼠,而僅有幾百個錘子。

我們需要打破常規觀念,不要認為人類的角色就是掌握死亡開關的最終決策者。

Facebook的問題不同於谷歌。谷歌評估的內容和提供的鏈接,都來自上千億個外部網頁,但 Facebook的內容均由平台用戶發布。

許多內容有外部網站的鏈接,其他則不然。即使有來自外部網站的內容,它也往往被重混成利於傳播的形式,也即模因——很多時候是從原文語境中抽離出來的有代表性的圖片或影片,它們可能是某個重要時刻,或是某句經典語錄。這類內容以分享為目的,設計上重視的是影響力,而不是深入的對話或理解。

由於缺乏上下文,谷歌所依賴的許多標記。例如萬維網的鏈接架構, Facebook都沒法用。

雖然某些技巧 Facebook也可以使用,但是它處理內容的基礎結構和商業流程不同於谷歌,這也是 Facebook想動員社區力量解決問題的原因之一。

假新聞的迅速擴散

推廣假新聞的人往往有強烈的動機讓事件發酵,他們使用程式化工具搜尋有影響力的人物,然後騙取他們的轉發,以快速傳播假新聞。

鑒於當今社會一個熱門消息能夠帶來巨大流量,專業新聞機構也會使用自動化的“社交傾聽工具 ”快速發掘熱門話題,不對事實進行嚴格核證,便隨即把一些消息在刊物上重新報導,這違背了主流媒體以往的報導原則。

一條虛假消息在被關注它的用戶或事實核證員打上標記之前,可能已經被分享了幾十萬次,被上百萬人閱讀過。即使原消息已被刪除,通常也不會妨礙假消息繼續傳播。

谷歌、 Facebook等公司有一條已落實的措施,是給有爭議的消息加標簽,或許這能有所幫助。因為標簽會隨消息一同傳播,隻不過標簽必須在消息被廣泛分享之前添加才有效。

但即使是這種方法也有局限性,因為沒什麽能阻擋一個有黨派或經濟利益的網站把同樣的假消息喬裝打扮一番,然後繼續散布。出現這種情況,又如何去鑒別?你還是得回過頭來向算法燈神求助,請它幫你打死地鼠。

此外,用戶自己不僅僅難以判定消息真偽,甚至難以發現網站提供的幫助他們判定消息權威性的標識。斯坦福的一項研究表明,僅有25%的高中生知道 Facebook和推特上藍色打鉤標記表示官方認證账號。給假新聞做標記的效果,又能好到哪兒去呢?

我們終須認識到,搜索引擎和社交媒體平台是網絡戰爭的沙場。

散播假新聞的既得利益者,不僅僅是政治參與者,這其中也涉及了巨大的經濟利益,為此有人不擇手段地操縱系統。因此,假新聞不是 Facebook的問題。

假新聞:互聯網商業模式中的陰暗面

在網絡犯罪中,這些手段不只是卑劣,而已經屬於違法行為了。2016年 12月,一個俄羅斯僵屍網絡被發現在製作有明確閱聽人的影片,同時,該網絡利用程式假扮成用戶,製造點擊觀看影片的假象,從而騙取每日 300萬到 500萬美元的巨額廣告收入。

換言之,這些人的武器不只是假新聞,他們還能派出假用戶,在點擊和點讚大戰中充當子虛烏有的小卒。

當攻擊者利用程式偽裝成用戶,其攻擊速度之快、規模之廣,是手無寸鐵的人工監督者無能力應對的。這也從另一角度說明,需要使用算法對付假新聞和社交媒體其他種種欺詐現象,而非僅依靠用戶判斷或者傳統新聞業的事實核證手段。這就像是對付垃圾郵件,要用過濾器。

問題在於,越來越多的網絡攻擊都實現了自動化,這些數字敵人搜尋網絡漏洞的速度極快,人類根本來不及修補。

真相是什麽

我們一直在講事實和謊言要經客觀核證。其實還有一個更具挑戰的問題,算法也能出其不意地助上一臂之力。

子虛烏有的資訊也會像病毒一樣在全球大腦中迅速擴散,塑造百萬人的信念。我們所知道的、我們所接觸到的東西,越來越多地由個性化算法決定,這類算法所做的,是從互聯網海量的內容裡面,挑選出它認為我們最有可能回應、最有興趣參與、最易被觸動情感的東西,而非簡單地擺事實。

算法核查事實

對於新聞來說,人們的熱情和基本面之間的距離也是可以被衡量的,且很多衡量指標可用算法來驗證,電腦比人類的驗證速度更快、角度更全。

當人們探討新聞的真偽,討論 Facebook、谷歌和推特這類平台網站去偽存真的責任之時,他們大概認為:判斷真偽就是評估內容本身,這需要主觀的判斷,所以電腦無法辨別。但是和谷歌搜索一樣,許多可用的標記獨立於實際內容。使用這些標記時,我們必須謹記柯日布斯基的警告,分清地圖與地圖想要勾勒的實際疆域。

用算法核證事實,並不是替代人類判斷。它會擴展我們的判斷能力,如同推土機成了人類肌肉的延伸。算法使用的標記,與人工事實核證員擬用的標記相似。故事或圖片有沒有引用來源?即使沒有引用來源,也不能就此斷定故事造假,但是捏造的可能性提高了,因此需要進一步調查。

一般假新聞都沒有消息來源。在追本溯源方面,電腦做得遠比人類出色:

來源是否有權威性?

在多年的搜索品質評估工作中,谷歌使用了很多技術手段。網站成立了多久?被信譽度高的其他網站引用了多少次?

大多數人認為,FBI是美國國家犯罪數據的權威來源。如果消息引用了量化數據,那它在數學上是否說得通?

《商業內幕 》的文章把 FBI數據經過標準化處理,顯示了每 10萬人口中的犯罪率,因此天然更具可信度,而捏造的選民地圖則促使我去尋找真相。話說回來,數學是電腦的強項。

引用來源是否論證了觀點呢?

如果故事和引用不沾邊,則可能有造假的嫌疑。早在大選前, Facebook就進行了大規模更新,打擊他們稱之為點擊誘餌的新聞標題。 Facebook研究了成千上萬份實際內容與標題不符的帖子,總結出標題中用來吸引用戶點擊閱讀的慣用詞匯,然後研發了一個算法,用於識別標題和內容不匹配的文章,並對其給予降級。把文章與引用來源進行匹配,也是甄別真偽的一種類似做法。

是否做到了同一個故事包括多家獨立觀點?

這是記者曾長期使用的技巧。曾幾何時,尋找真相是新聞報導的核心。一個故事無論聽上去多麽有趣,只要消息來源單一,則絕不會報導出去。尋找多方確認的消息來源,也是電腦非常擅長的工作。

電腦不僅能找出多方表述,也能判定哪條來源率先發布,哪些是在重複別人,發布消息的網站或用戶名已存在多久,它多久發表一次類似的文章,以及從哪個地理位置發表內容。

在線媒體的消費者不大可能以同樣的方式進行自我培訓,學會判斷新聞真偽。特別是在讀到的故事能給自己的偏見提供佐證時,很少有人會去搜索故事相同、但觀點不合的其他文章。

因為算法能嚴格執行規則,所以它也善於關注人類會忽略的東西。

引用來源和來源鏈接使我們更易核實:一種說法是屬於某人觀點,還是他人解讀,以及出自誰之口。這應該是所有報導的黃金標準。如果媒體都提供可靠的新聞來源鏈接,則沒有引用鏈接的文章就自動被視為可疑。

當然,有的情況下記者依賴匿名來源。這讓我們想起了水門事件中為記者提供重要資料的線人“深喉”。

當年,美國《華盛頓郵報 》記者伍德沃德和伯恩斯坦沒有把“深喉”的爆料作為小道消息公之於眾,而是花了幾個月的時間跟蹤調查,用確鑿的證據證明深喉的說法屬實。相比之下,如今的新聞行業操守已經節節敗退。

合理懷疑

發現假新聞後,有幾種可能的回應方式。

如果極為確定,則可以全面壓製謠言的擴散。

但這種手段應慎用,因為它一不留神就會變成新聞審查。儘管我們對新聞審查持有極端偏見,但其實我們在其他在線應用程式中早已依賴於這種手段,電子郵件供應商就是通過它每天從幾十億的垃圾郵件中過濾出我們想看的郵件。

其實這些假新聞可以被打上標記。例如 Facebook( 或者在線郵件系統如 Gmail,因為許多假新聞也通過郵件傳播)可以顯示警告,類似於安全警告,提示:“該文章內容可能不實,你確定分享嗎?”然後附上解釋為什麽文章可疑的鏈接,若有揭穿騙局的文章鏈接則更佳。

遺憾的是,Facebook並無意成為真相的仲裁者,哪怕新聞是來源於已知的假新聞網站。這意味著他們的工作效果沒有達到應有的水準。

獲得更多的PTT最新消息
按讚加入粉絲團