每日最新頭條.有趣資訊

人肉身份的“原諒寶”:“科技向善”的反面

本文首發於航通社,原創文章未經授權禁止轉載。

航通社網站:lishuhang.me 微信號:lifeissohappy 微博:@航通社

書航 6 月 1 日發於北京

2017 年,程序員蘇享茂因遭遇前妻翟欣欣“騙婚”索要1000萬元和房產賠償而自殺,引發了社會對”老實人“程序員”接盤“的關注和調侃。

最近,有人號稱開發出了檢測”小姐姐“的 AI 產品,聲稱是為了”解救“程序員群體,最終卻頂不住輿論壓力以”刪庫跑路“告終。

這樣的產品,一旦真的做出來並流行開去,會帶來怎樣的社會影響?假設它真的有效,你會用它和相信它嗎?

|它是什麽

5 月 27 日,微博用戶 @將記憶深埋 表示,他完成了在半年前開始準備的一個項目:將色情網站上的公開視頻和圖片打標簽後做匹配,以實現所謂“以圖搜片”,查詢者可以通過上傳女性照片、視頻和數據庫做匹配,判斷該女性是否疑似從事過色情行業。

他表示,已經“在全球範圍內成功識別了 10 多萬名”疑似從事色情行業的女性,同時,可以對美顏、Deepfakes 換臉等有效對抗,識別率達到 99%;而對於聲音語氣模仿採用聲紋檢測對抗,識別率達到 100%。

不過,他只是自己宣稱而已,並且他以害怕違法為由,拒絕開放 API 或查詢頁面,也不公布論文或開源算法,而是打算做成一個商業產品。有熱心網友替他想好了產品的名字:“原諒寶”。

微博下面一片罵聲。激烈反對的以女性居多,相反堅定的支持者多為男性。支持者們認為,在微博下反對的女性反而是”自投羅網“;甚至據傳,有一位反對者的微博被”挖墳“,發現了所謂”黑歷史“。這就意味著,即使是發個帖說下反對意見,也必須做好萬全的準備,確保萬無一失才行。

5 月 31 日,本來說要直播接受媒體採訪的作者取消了原計劃,同時刪除了整個項目和數據庫,因言論給他人造成不便而道歉告終。只是對這個項目的討論並沒有隨著作者”刪庫跑路“而終結。

正如劉慈欣在科幻小說《鏡子》中說的那樣,即使某一個人有了驚人發現後秘而不宣,地球上一定會有同時想到同一個點子的其它人率先打破沉默,公開同樣的成果。[1]

|它可能有私心

令人疑惑的是,作者宣布這是一個商業化的軟體,即使他自稱將把維持伺服器開銷後的其他收入,用來捐助所謂的防治艾滋病基金。

然而,他並沒有選擇最穩妥,也最可靠的方法以獲得潛在使用者的信任——也就是將整個技術和背後所用的素材庫開源。沒有開源,代碼便不能接受監督,而外部人士也完全有理由來懷疑它是”暗箱操作“。

例如,產品正常判斷出結果之後,有可能被植入一些特定人的特定信息,做所謂”人為矯正“。這就意味著即使其數據源網站中並不存在的片段,也有可能會出現在原諒寶的結果當中。

反過來,也有一些人可能已經識別到,但是假設這人交一些錢,或者採用一些手段,就可以讓”原諒寶“不顯示這個識別結果,相當於是買了 VIP 會員就”隱身“。

如果不是完全開源以證清白的話,沒有辦法證明作者能抵擋得住這樣的誘惑。

有人說,市場上也有對男版”原諒寶“的強烈需求。問題在於,要找出所謂”渣男“的證據,露臉的圖片或視頻遠遠比不上之前傳出洩露的開房記錄有效。

在眾多”資源“中,男性的臉和身材並不是觀眾”欣賞“的主要對象,男主不出現都沒關係,更準確的說是不希望他出現,有很多片子是所謂的第一人稱視角。這就會使男性在片中曝光的可能性遠遠小於女性。

更不用說,這其中有一些片段,其實是此前所謂”裸貸“、”裸條“的產物。其中的女性是被逼迫拍攝的,並非本人自願,當然就更不可能有男性出場。因此,男性的數據集要遠遠少於女性,如果要做”男版原諒寶“的話,準確率也會更低。

但是女性的需求卻是真實存在的。《谷雨》的特稿描寫了香港的”私家偵探社“,他們就像是“民間的警察”,幫助客戶解決警察無法處理的隱形問題。他們經手的多是商業調查和家庭糾紛,後者包括調查子女吸毒援交、配偶婚外情等。[2]

與這些真實而迫切的需求相比,僅通過”小姐姐“單點突破的”原諒寶“,其產品設計上不可言傳的曖昧就非常明顯了。

|它不能確保萬無一失

即便”原諒寶“用某種方法證明了自身的中立和非歧視,但仍有或許不可逾越的技術門檻。

人臉識別可能在某些地方已經比較精準,但在缺乏一個準確的數據庫的前提下,”冷啟動“的準確率仍然不高,這是一個即使連谷歌或百度這樣的技術巨頭都尚且無法解決的問題。

現在,蘋果 [3] 和谷歌 [4] 都在各自的作業系統中,準備把現有的 AI 算法從網絡調用變成本地運算,將整個包壓縮到手機能承載的範圍之內,搭載最新的 AI 芯片,以便將一些在線運算轉為本地運算,以充分保護用戶的隱私。

即便如此,這也並不意味著經過少數訓練,甚至基本沒有訓練過的某張隨意給定的照片,都能得到很高的準確率。

”原諒寶“聲稱使用的都是公開資源,一些早已出名的”下海“人士的面孔當然是清晰的,但是識別出來也沒有太大意義。至於所謂”素人“,要麽臉部有遮擋,要麽來自偷拍,導致圖像晃動或質量不佳,發生誤判的幾率非常高。[5]

而且,即使是給定的幾個網絡社區,也不能說其上傳的所有內容都是所謂”自願“的。由分手後有意報復的一方上傳的”復仇色情“(Revenge Porn)或者 Deepfakes 等製造的”換臉視頻“,都沒有 100% 保險的區分辦法。

”原諒寶“作者目前為止披露的技術手段,跟外界預測的沒有太大區別,所以他所講的準確率也不讓人信服。

|它助長傳謠,不能辟謠

”原諒寶“的出現還可能促成不準確的結果大舉流傳,演變為謠言的傳播,給可能無辜的當事人帶來不可挽回的傷害。

”原諒寶“如何建立自身可信度,以及攻克技術難關都尚且存疑,不過有很多評論者已經決定信以為真。具體使用者不一定能準確的認識到查詢結果的模糊性,並在使用時留一個心眼。

一部分原因是,之前出現過有些違規使用戶籍查詢系統來做”人肉搜索“的情形。由於戶籍不靠算法,可以認為是 100% 準確的,只需要考證截屏是否為偽造;而圖象真偽,往往又是由所謂”線人“的人格做擔保的,可以尋根溯源。這使得人們習慣了相對”精準“的人肉搜索結果。但是,如果也用同樣的眼光來看待”原諒寶“生成的,準確度只有一定概率的結果,就非常容易產生誤判。

誤判之後,能否糾正呢?太困難了。像是最近有一個謠言說華為跟阿聯酋簽署了 5G 協議,阿聯酋為答謝華為在杜拜塔開展燈光秀。這個傳聞已經連續兩三天出現在我的朋友圈和群聊當中,即使是一些本身就從事傳媒行業的朋友也會轉發過來。

實際上,阿聯酋與華為簽署 5G 協議是今年 2 月初的 [6] ;杜拜哈裡發塔亮燈發生在去年 10 月 Mate 20 [7] 和今年 4 月 P30 的中東發布會 [8] 期間。但是,在已經廣泛辟謠後,此消息仍在流傳的現實,再次證明了”造謠一張嘴,辟謠跑斷腿“的道理。

所以,我們並不能指望萬一”原諒寶“發生誤判之後,就能突然以良好的機制來防止謠言擴散和辟謠。倒不如說,由於”原諒寶“所引發的謠言傳播,幾乎在這個產品公布出來的那一刻,就是注定了的。

|它本質上是”人肉搜索“

“原諒寶”所採用的原始數據,以公開狀態在網上放了很長時間,並沒有掀起什麽風浪。然而,這是因為這些數據是打散的,並且沒有形成一個系統的鏈條。

如果“原諒寶”真的如其作者所聲稱的一般,可以通過極其簡易的方法,實現對數據的梳理和總結,使得普通人利用這些信息成為可能,這些信息就從幾乎等於不存在一樣,轉變為對當事人真實可見的威脅。

即使並非“開房”這樣敏感的數據,只是一個人普通的人生軌跡,形成完整的鏈條之後,後果都可以相當嚴重。微博名人和菜頭曾經提出,微博可以幫助人販子得知博主及孩子的各種詳細線索。有位女網友不相信,和菜頭就把她的 700 多條微博翻了個遍,並出具了一份含有她所在城市、工作部門地址、孩子的姓名、生日、常去的地方以及家庭結構等的分析報告。[9]

歷史上,QQ [10] 、支付寶 [11] 和抖音[12] 都遇到使用者投訴,說利用通訊錄、算法等分析得出的“你可能認識的人”推送功能,向其推送了並不願意再聯繫的前男友或前女友。即使是這樣完全不涉及敏感信息的功能都能遭到爭議,那麽像“原諒寶”所涉及的領域,如果不遭到更大的非議,反而就很奇怪了。

很多人在匿名狀態下,失去了社會身份的約束,容易激發出人性中黑暗的一面。對於涉及別人的隱私,大家都很願意窺探,有窺私心理,而如果是涉及到自己的隱私洩露出去,則一定要堅決反對。

不知是受到先天的影響,還是後天的規訓,不同的性別也體現出不同的立場。對自身隱私和安全滿不在乎,又有強烈的窺私欲望的,男性居多;反過來,既對別人的歷史和隱私不感興趣,又強烈的在意自己的隱私被曝光的,女性居多。

但有趣的是,經常到別人的微博底下挖墳扒黑歷史的,男女都有,特別是在一些觸及粉絲”逆鱗“的地方,女性尤甚。[13]

其實,這種因窺私而穿透別人隱藏於互聯網各個角落的個人信息,並將其串聯起來的行為,正好就是上文說到的”原諒寶“的作用——將打散的數據整合為證據鏈條,梳理出一個人的數字足跡,帶來了極大的社會隱患和人人自危的不安全感。

|它的初衷,有更好的方式去實現

作者說,”原諒寶“開發的初衷是為了避免程序員陷入所謂的”女神“陷阱。然而,如果只是想讓程序員不做”接盤俠“,想讓他們找到品行端正的另一半,就只有這一條路可走?

除了這種反向識別出”小姐姐“的方式之外,明明還是有可以正向識別的方式的。為什麽人工智能不能通過一些選擇項,讓一些默默無聞,藏於深閨,但又渴望真實愛情的好女孩,在人群當中脫穎而出呢?

”母胎單身“絕不可能是男性獨有的問題,特別是當城市裡其實湧入了不少出身農村,但不願回去的女孩的情況下,總是會出現單身男女相互不匹配的”結構性資源短缺“。

在知乎的情感問題區,有很多類似”如何讓一個男生喜歡上你“的由女性提出的問題。中國孩子在成長階段,一般都被”禁止早戀“的家長粗暴剝奪了自學戀愛技能的機會,一到上大學或畢業,又被趕鴨子上架要求解決對象問題。這樣培養出的,當然有兩耳不聞窗外事的男碼農,但誰說這樣就不能產出覺得戀愛是羞恥的,釋放女性魅力是”放蕩“的,從而過度封閉自我,不為人注意的女孩呢?[14]

那麽,如果這樣的女孩能夠找到一個同樣老實,不會背叛的,又顧家,又上進的程序員,這實際不也是”天作之合“嗎?這樣的信息,是否能夠通過一個正向的所謂”戀愛寶“這樣的東西來匹配呢?為什麽作者不能從這個方向去想?

退一步講,即使是從避免”感情騙子“的角度講,也完全可以做一些更為基礎性的工作。

以翟欣欣為例,有人評價她的對外檔案十分符合所謂”好嫁風“的描述:長得漂亮,但是穿得很保守,看起來土土的;家世好,家裡有點錢,好大學畢業,有不錯的工作 [15]。但事發後,她被曝光資料作假,曾有婚史。

這種信息很大概率不會出現在”原諒寶“的數據集當中,但它實際上是”碼農“們更需要的。都說區塊鏈追根溯源能解決差不多一切問題,能用區塊鏈或者大數據揪出婚戀網站的公開資料造假嗎?這不是比充滿了性暗示的”原諒寶“更有用?

小時候,我讀到一個故事,但現在已很難找到。故事說,一個優秀的銀行驗鈔員被問到有什麽檢驗的技巧時說,自己也不知道有什麽竅門,只是接觸紙幣時間長了,能感覺到假幣的手感不像是真的。

後來,我找到一個媒體報導,說某地發現的拚接假幣,驗鈔機無法識別,是櫃台服務人員手工點鈔時發現的。[16]

這種”無他,唯手熟爾“的故事說明,解決同樣一個問題,我們可以用反向的”堵“,用預設他人不可信任的方法,也可以用正向的”疏“,用給社會造成更小分歧與創傷的手段。

在我看來,現在很流行的概念”科技向善“不需要企業一定得做慈善,而是在面臨這樣的抉擇的時候,去選擇那些彌合分歧,而不是撕裂分歧的辦法,用保護他人,而不是傷害他人的辦法,用雙贏,而不是零和遊戲的辦法,這樣就已經是最大的”善“了。

而”原諒寶“這個產品體現出的,就是”科技向善“的反面。

[1] http://www.kehuan.net.cn/book/jingzi/14.html

[4] https://www.leiphone.com/news/201905/ArmUEPJXPEx00fuZ.html

[5] https://www.zhihu.com/question/326781498/answer/699600752

[6] https://news.sina.com.cn/c/2019-02-27/doc-ihsxncvf8136019.shtml

[7] https://www.weibo.com/3032210184/GFyC2nATV

[8] https://www.weibo.com/3032210184/HnN6OleI5

[10] https://www.geekpark.net/news/155595

[11] https://news.mydrivers.com/1/495/495337.htm

[12] https://news.mydrivers.com/1/619/619833.htm

[14] https://www.zhihu.com/question/267027873/answer/599314321

[15] https://baijiahao.baidu.com/s?id=1601606367980732550

[16] http://www.dffyw.com/fayanguancha/sh/200901/20090117195040.htm

獲得更多的PTT最新消息
按讚加入粉絲團