人肉身份的“原諒寶”：“科技向善”的反面

本文首發於航通社，原創文章未經授權禁止轉載。

航通社網站：lishuhang.me 微信號：lifeissohappy 微博：@航通社

書航 6 月 1 日發於北京

2017 年，程序員蘇享茂因遭遇前妻翟欣欣“騙婚”索要1000萬元和房產賠償而自殺，引發了社會對”老實人“程序員”接盤“的關注和調侃。

最近，有人號稱開發出了檢測”小姐姐“的 AI 產品，聲稱是為了”解救“程序員群體，最終卻頂不住輿論壓力以”刪庫跑路“告終。

這樣的產品，一旦真的做出來並流行開去，會帶來怎樣的社會影響？假設它真的有效，你會用它和相信它嗎？

|它是什麽

5 月 27 日，微博用戶 @將記憶深埋表示，他完成了在半年前開始準備的一個項目：將色情網站上的公開視頻和圖片打標簽後做匹配，以實現所謂“以圖搜片”，查詢者可以通過上傳女性照片、視頻和數據庫做匹配，判斷該女性是否疑似從事過色情行業。

他表示，已經“在全球範圍內成功識別了 10 多萬名”疑似從事色情行業的女性，同時，可以對美顏、Deepfakes 換臉等有效對抗，識別率達到 99%；而對於聲音語氣模仿採用聲紋檢測對抗，識別率達到 100%。

不過，他只是自己宣稱而已，並且他以害怕違法為由，拒絕開放 API 或查詢頁面，也不公布論文或開源算法，而是打算做成一個商業產品。有熱心網友替他想好了產品的名字：“原諒寶”。

微博下面一片罵聲。激烈反對的以女性居多，相反堅定的支持者多為男性。支持者們認為，在微博下反對的女性反而是”自投羅網“；甚至據傳，有一位反對者的微博被”挖墳“，發現了所謂”黑歷史“。這就意味著，即使是發個帖說下反對意見，也必須做好萬全的準備，確保萬無一失才行。

5 月 31 日，本來說要直播接受媒體採訪的作者取消了原計劃，同時刪除了整個項目和數據庫，因言論給他人造成不便而道歉告終。只是對這個項目的討論並沒有隨著作者”刪庫跑路“而終結。

正如劉慈欣在科幻小說《鏡子》中說的那樣，即使某一個人有了驚人發現後秘而不宣，地球上一定會有同時想到同一個點子的其它人率先打破沉默，公開同樣的成果。[1]

|它可能有私心

令人疑惑的是，作者宣布這是一個商業化的軟體，即使他自稱將把維持伺服器開銷後的其他收入，用來捐助所謂的防治艾滋病基金。

然而，他並沒有選擇最穩妥，也最可靠的方法以獲得潛在使用者的信任——也就是將整個技術和背後所用的素材庫開源。沒有開源，代碼便不能接受監督，而外部人士也完全有理由來懷疑它是”暗箱操作“。

例如，產品正常判斷出結果之後，有可能被植入一些特定人的特定信息，做所謂”人為矯正“。這就意味著即使其數據源網站中並不存在的片段，也有可能會出現在原諒寶的結果當中。

反過來，也有一些人可能已經識別到，但是假設這人交一些錢，或者採用一些手段，就可以讓”原諒寶“不顯示這個識別結果，相當於是買了 VIP 會員就”隱身“。

如果不是完全開源以證清白的話，沒有辦法證明作者能抵擋得住這樣的誘惑。

有人說，市場上也有對男版”原諒寶“的強烈需求。問題在於，要找出所謂”渣男“的證據，露臉的圖片或視頻遠遠比不上之前傳出洩露的開房記錄有效。

在眾多”資源“中，男性的臉和身材並不是觀眾”欣賞“的主要對象，男主不出現都沒關係，更準確的說是不希望他出現，有很多片子是所謂的第一人稱視角。這就會使男性在片中曝光的可能性遠遠小於女性。

更不用說，這其中有一些片段，其實是此前所謂”裸貸“、”裸條“的產物。其中的女性是被逼迫拍攝的，並非本人自願，當然就更不可能有男性出場。因此，男性的數據集要遠遠少於女性，如果要做”男版原諒寶“的話，準確率也會更低。

但是女性的需求卻是真實存在的。《谷雨》的特稿描寫了香港的”私家偵探社“，他們就像是“民間的警察”，幫助客戶解決警察無法處理的隱形問題。他們經手的多是商業調查和家庭糾紛，後者包括調查子女吸毒援交、配偶婚外情等。[2]

與這些真實而迫切的需求相比，僅通過”小姐姐“單點突破的”原諒寶“，其產品設計上不可言傳的曖昧就非常明顯了。

|它不能確保萬無一失

即便”原諒寶“用某種方法證明了自身的中立和非歧視，但仍有或許不可逾越的技術門檻。

人臉識別可能在某些地方已經比較精準，但在缺乏一個準確的數據庫的前提下，”冷啟動“的準確率仍然不高，這是一個即使連谷歌或百度這樣的技術巨頭都尚且無法解決的問題。

現在，蘋果 [3] 和谷歌 [4] 都在各自的作業系統中，準備把現有的 AI 算法從網絡調用變成本地運算，將整個包壓縮到手機能承載的範圍之內，搭載最新的 AI 芯片，以便將一些在線運算轉為本地運算，以充分保護用戶的隱私。

即便如此，這也並不意味著經過少數訓練，甚至基本沒有訓練過的某張隨意給定的照片，都能得到很高的準確率。

”原諒寶“聲稱使用的都是公開資源，一些早已出名的”下海“人士的面孔當然是清晰的，但是識別出來也沒有太大意義。至於所謂”素人“，要麽臉部有遮擋，要麽來自偷拍，導致圖像晃動或質量不佳，發生誤判的幾率非常高。[5]

而且，即使是給定的幾個網絡社區，也不能說其上傳的所有內容都是所謂”自願“的。由分手後有意報復的一方上傳的”復仇色情“（Revenge Porn）或者 Deepfakes 等製造的”換臉視頻“，都沒有 100% 保險的區分辦法。

”原諒寶“作者目前為止披露的技術手段，跟外界預測的沒有太大區別，所以他所講的準確率也不讓人信服。

|它助長傳謠，不能辟謠

”原諒寶“的出現還可能促成不準確的結果大舉流傳，演變為謠言的傳播，給可能無辜的當事人帶來不可挽回的傷害。

”原諒寶“如何建立自身可信度，以及攻克技術難關都尚且存疑，不過有很多評論者已經決定信以為真。具體使用者不一定能準確的認識到查詢結果的模糊性，並在使用時留一個心眼。

一部分原因是，之前出現過有些違規使用戶籍查詢系統來做”人肉搜索“的情形。由於戶籍不靠算法，可以認為是 100% 準確的，只需要考證截屏是否為偽造；而圖象真偽，往往又是由所謂”線人“的人格做擔保的，可以尋根溯源。這使得人們習慣了相對”精準“的人肉搜索結果。但是，如果也用同樣的眼光來看待”原諒寶“生成的，準確度只有一定概率的結果，就非常容易產生誤判。

誤判之後，能否糾正呢？太困難了。像是最近有一個謠言說華為跟阿聯酋簽署了 5G 協議，阿聯酋為答謝華為在杜拜塔開展燈光秀。這個傳聞已經連續兩三天出現在我的朋友圈和群聊當中，即使是一些本身就從事傳媒行業的朋友也會轉發過來。

實際上，阿聯酋與華為簽署 5G 協議是今年 2 月初的 [6] ；杜拜哈裡發塔亮燈發生在去年 10 月 Mate 20 [7] 和今年 4 月 P30 的中東發布會 [8] 期間。但是，在已經廣泛辟謠後，此消息仍在流傳的現實，再次證明了”造謠一張嘴，辟謠跑斷腿“的道理。

所以，我們並不能指望萬一”原諒寶“發生誤判之後，就能突然以良好的機制來防止謠言擴散和辟謠。倒不如說，由於”原諒寶“所引發的謠言傳播，幾乎在這個產品公布出來的那一刻，就是注定了的。

|它本質上是”人肉搜索“

“原諒寶”所採用的原始數據，以公開狀態在網上放了很長時間，並沒有掀起什麽風浪。然而，這是因為這些數據是打散的，並且沒有形成一個系統的鏈條。

如果“原諒寶”真的如其作者所聲稱的一般，可以通過極其簡易的方法，實現對數據的梳理和總結，使得普通人利用這些信息成為可能，這些信息就從幾乎等於不存在一樣，轉變為對當事人真實可見的威脅。

即使並非“開房”這樣敏感的數據，只是一個人普通的人生軌跡，形成完整的鏈條之後，後果都可以相當嚴重。微博名人和菜頭曾經提出，微博可以幫助人販子得知博主及孩子的各種詳細線索。有位女網友不相信，和菜頭就把她的 700 多條微博翻了個遍，並出具了一份含有她所在城市、工作部門地址、孩子的姓名、生日、常去的地方以及家庭結構等的分析報告。[9]

歷史上，QQ [10] 、支付寶 [11] 和抖音[12] 都遇到使用者投訴，說利用通訊錄、算法等分析得出的“你可能認識的人”推送功能，向其推送了並不願意再聯繫的前男友或前女友。即使是這樣完全不涉及敏感信息的功能都能遭到爭議，那麽像“原諒寶”所涉及的領域，如果不遭到更大的非議，反而就很奇怪了。

很多人在匿名狀態下，失去了社會身份的約束，容易激發出人性中黑暗的一面。對於涉及別人的隱私，大家都很願意窺探，有窺私心理，而如果是涉及到自己的隱私洩露出去，則一定要堅決反對。

不知是受到先天的影響，還是後天的規訓，不同的性別也體現出不同的立場。對自身隱私和安全滿不在乎，又有強烈的窺私欲望的，男性居多；反過來，既對別人的歷史和隱私不感興趣，又強烈的在意自己的隱私被曝光的，女性居多。

但有趣的是，經常到別人的微博底下挖墳扒黑歷史的，男女都有，特別是在一些觸及粉絲”逆鱗“的地方，女性尤甚。[13]

其實，這種因窺私而穿透別人隱藏於互聯網各個角落的個人信息，並將其串聯起來的行為，正好就是上文說到的”原諒寶“的作用——將打散的數據整合為證據鏈條，梳理出一個人的數字足跡，帶來了極大的社會隱患和人人自危的不安全感。

|它的初衷，有更好的方式去實現

作者說，”原諒寶“開發的初衷是為了避免程序員陷入所謂的”女神“陷阱。然而，如果只是想讓程序員不做”接盤俠“，想讓他們找到品行端正的另一半，就只有這一條路可走？

除了這種反向識別出”小姐姐“的方式之外，明明還是有可以正向識別的方式的。為什麽人工智能不能通過一些選擇項，讓一些默默無聞，藏於深閨，但又渴望真實愛情的好女孩，在人群當中脫穎而出呢？

”母胎單身“絕不可能是男性獨有的問題，特別是當城市裡其實湧入了不少出身農村，但不願回去的女孩的情況下，總是會出現單身男女相互不匹配的”結構性資源短缺“。

在知乎的情感問題區，有很多類似”如何讓一個男生喜歡上你“的由女性提出的問題。中國孩子在成長階段，一般都被”禁止早戀“的家長粗暴剝奪了自學戀愛技能的機會，一到上大學或畢業，又被趕鴨子上架要求解決對象問題。這樣培養出的，當然有兩耳不聞窗外事的男碼農，但誰說這樣就不能產出覺得戀愛是羞恥的，釋放女性魅力是”放蕩“的，從而過度封閉自我，不為人注意的女孩呢？[14]

那麽，如果這樣的女孩能夠找到一個同樣老實，不會背叛的，又顧家，又上進的程序員，這實際不也是”天作之合“嗎？這樣的信息，是否能夠通過一個正向的所謂”戀愛寶“這樣的東西來匹配呢？為什麽作者不能從這個方向去想？

退一步講，即使是從避免”感情騙子“的角度講，也完全可以做一些更為基礎性的工作。

以翟欣欣為例，有人評價她的對外檔案十分符合所謂”好嫁風“的描述：長得漂亮，但是穿得很保守，看起來土土的；家世好，家裡有點錢，好大學畢業，有不錯的工作 [15]。但事發後，她被曝光資料作假，曾有婚史。

這種信息很大概率不會出現在”原諒寶“的數據集當中，但它實際上是”碼農“們更需要的。都說區塊鏈追根溯源能解決差不多一切問題，能用區塊鏈或者大數據揪出婚戀網站的公開資料造假嗎？這不是比充滿了性暗示的”原諒寶“更有用？

小時候，我讀到一個故事，但現在已很難找到。故事說，一個優秀的銀行驗鈔員被問到有什麽檢驗的技巧時說，自己也不知道有什麽竅門，只是接觸紙幣時間長了，能感覺到假幣的手感不像是真的。

後來，我找到一個媒體報導，說某地發現的拚接假幣，驗鈔機無法識別，是櫃台服務人員手工點鈔時發現的。[16]

這種”無他，唯手熟爾“的故事說明，解決同樣一個問題，我們可以用反向的”堵“，用預設他人不可信任的方法，也可以用正向的”疏“，用給社會造成更小分歧與創傷的手段。

在我看來，現在很流行的概念”科技向善“不需要企業一定得做慈善，而是在面臨這樣的抉擇的時候，去選擇那些彌合分歧，而不是撕裂分歧的辦法，用保護他人，而不是傷害他人的辦法，用雙贏，而不是零和遊戲的辦法，這樣就已經是最大的”善“了。

而”原諒寶“這個產品體現出的，就是”科技向善“的反面。

[1] http://www.kehuan.net.cn/book/jingzi/14.html

[4] https://www.leiphone.com/news/201905/ArmUEPJXPEx00fuZ.html

[5] https://www.zhihu.com/question/326781498/answer/699600752

[6] https://news.sina.com.cn/c/2019-02-27/doc-ihsxncvf8136019.shtml

[7] https://www.weibo.com/3032210184/GFyC2nATV

[8] https://www.weibo.com/3032210184/HnN6OleI5

[10] https://www.geekpark.net/news/155595

[11] https://news.mydrivers.com/1/495/495337.htm

[12] https://news.mydrivers.com/1/619/619833.htm

[14] https://www.zhihu.com/question/267027873/answer/599314321

[15] https://baijiahao.baidu.com/s?id=1601606367980732550

[16] http://www.dffyw.com/fayanguancha/sh/200901/20090117195040.htm