知乎算法戰“杠精”

關注並標星36氪

每天3次，打卡閱讀

更快更深刻洞察互聯網商業

━━━━━━

運營一個2.2億用戶規模的社區，算法可能是最優解。

文 | 孫然

編輯 | 石海威

孫達雲幾乎從不罵人。他長得白瘦斯文，架著副黑框眼鏡，一臉的書生氣。哪怕跟人爭執到臉紅脖子粗，嘴裡也蹦不出半個髒字兒。

但技術層面上，他可能是研究網絡謾罵造詣最深的人。作為知乎第一個社區管理員，孫達雲就是那個戴著“認真、專業、友善”的紅袖箍，每天瀏覽著各種嬉笑怒罵的人。幾年前他根據知乎站內帖整理出一張表：罵人的方式有上千種，光“SB”一個詞就有幾百個變體。都是字音字形的變化，再加上方言、小語種，不勝枚舉。

從2011年灌水文化的“認真你就輸了”，到“喪”，再到如今的“佛系”和“扛精”，孫達雲一路看著網絡主流文化的演變。

與之對應的，答非所問、評論區水化、回復者陰陽怪氣、找到志同道合的人越來越難的情況像病毒一樣蔓延開，使一批知乎大V逐漸變成潛水獸，甚至淡出社區。這些負面情緒正在威脅著內容社區賴以為生的根本——那些優秀答主們生產內容的熱情。

知乎心理學話題優秀答主曾旻，最近兩年已經不太看評論了。

“早期粉絲在1萬以下的時候，還常回復，現在14萬了，回復不過來了。”另一層原因，評論品質不如當初高了。最近他發了條熱帖，評論被折疊了十幾條。被機器自動折疊的，通常是非理性又缺乏營養的發泄情緒帖，這不是對知乎社區有價值的內容，同時這種處理也是對曾旻的保護。

2018年，知乎的用戶量大幅攀升，從去年底的1.2億，到今年11月底變成了2.2億。大量新增用戶來自知乎開拓中的三四線城市。跟“小而美”的果殼不同，知乎並不想做烏托邦。更大的用戶量，也是它尋求更多廣告變現的基礎。

新居民和舊居民、專業答主和不專業的調侃者、不同興趣和表達方式的人，在這座虛擬城市中交匯。多元化豐富了知乎，但也帶來了更多潛在的衝突。

社區氛圍管理的難度提高了，它要滿足的差異化口味也更多了。知乎決定用機器算法解決這個問題：基於算法，志趣相投的人之間被“架起橋梁”，可能爆發惡性衝突的人則會像永不交織的平行線。

習得你興趣後的機器將決定你會收到什麽推送、看到多大的世界，機器也將作為輿論警察，消除城市中的負面情緒和暴力。當每個人都能從獲取資訊中收獲滿足感，這座城市才是穩定和繁榮的。

至於算法要如何拯救你於“呵呵”或者“撕逼微笑臉”？又如何實現這座城市的用戶和內容分層？以下要呈現的就是這麽個故事。

算法vs杠精

跟其他網絡社區相比，如果說知乎上的負面情緒帖有什麽特點，那就是罵人不吐髒字兒，以及愛抬杠。

“春江水暖鴨先知，”一位知乎用戶發了條文藝帖。不久後，他收到一條評論：“為什麽是鴨先知？驢就不知嗎？鵝就不知嗎？蝦呢？蟹呢？跟你說了嗎？”

知乎正為此憂慮。杠精引發的憋屈和憤怒，無形中在社區裡蔓延。

36氪獲得了知乎上被投訴最多的“陰陽怪氣”們：

呵呵，就你厲害。

你高興就好。

你站在道德的高地上就不冷麽？

就你懂，可真把你牛逼壞了。

腦子是個好東西，不建議智商太低、聽風就是雨的人擁有。

你的答案很有水準！你博士快畢業了吧？

替我向你的體育老師問好，你的語文是他啟蒙的吧？

“一個人突然罵你，你頂多呵呵，拉黑就好了，但他一直嘲諷你，你又很不爽。”

孫達雲是最早感知到變化的人。過去7年，罵人文化在知乎已經消弭，但今年管理員團隊的信箱裡躺著大量投訴陰陽怪氣的郵件，這讓他們很頭疼。“我們把底線問題解決的差不多了，不過大家對互聯網生態的要求也變高了。”

梁源是知乎書法話題優秀回答者，自稱專業杠精，但有趣的是，他也是“陰陽怪氣”展的核心策展人之一。

這是個頗為“以暴製暴”的藝術展，展示著各種書法字體寫出來的知乎站內的“陰陽怪氣”們。

逛到展區末端，一個糖果色的小房間，四角放著音箱，滾動播放著幾百種方言錄製陰陽怪氣。大部分人幾分鐘就坐不住了，被“杠”了出來。

“梁源們”是知乎一直以來感到自豪的原因——這是一群對社區氛圍敏感的人，且參與度很高。

無論看到不好的，還是讓他們不爽的，或是不希望出現在知乎的內容，都會點舉報。可以說這群用戶很不好“伺候”，但他們更樂於生產內容，更重要的是，他們的行為相當於人工標注，為後期知乎算法去學習場景提供了訓練樣本。

早期的知乎，就是靠用戶舉報和人工運營，去逐條處理帖子裡的情緒毒瘤。

但隨著知乎社區的擴大，一二十個管理員運轉的人工作業模式很快遇到了瓶頸。如今，平均每天知乎上會產生10萬條回答，它們會衍生出50萬至60萬條評論，這些內容中又有成千上萬條會被用戶標注為舉報。

這意味著，無論處理量，還是處理的時效性，都已經超出人工乾預能承受的負荷。

2016年，知乎上線了機器人瓦力。瓦力的任務，是識別並處理那些不友善、辱罵、陰陽怪氣、答非所問、色情內容以及知乎不鼓勵的用戶爆照。

起初，教瓦力識別“不友善”的方式並不複雜。負責瓦力的算法工程師，會根據不同場景，人工構建包含一些嘲諷特徵的關鍵詞匯包，輸入算法作為一種衡量維度。當檢測到不友善關鍵詞，瓦力就會自動折疊答案。

但隨著瓦力試圖識別反諷評論，也就是所謂罵人不吐髒字的陰陽怪氣，關鍵詞法則失效了。諷刺對負面情緒的表達，隱蔽又多變。如果不看上下文語境，人類也未必聽得出來。

“比如上文說你數學考了100分，我說你太牛了，那就是讚揚。但如果上文是你數學考了20分，那這就是諷刺。”瓦力的算法負責人劉兆來告訴36氪。

另一個問題是，數學考20分是高是低？對於人類，生活常識會積累起感性的判斷。但對於機器，這種價值判斷卻無從著手。當算法試圖識別諷刺，擺在它面前的就是各式各樣的場景，和各式各樣的價值判斷。

知乎現階段的解決方式，是以超過70%的人都點踩的語句，作為不友善的訓練樣本。相對於大部分論壇，知乎用戶的特徵是參與度高，無論內容生產還是評論。類似訓練樣本需要的人工標注的舉報，知乎平均每天會收到上萬條。

除此之外，機器也有自己的觀察維度，數據會揭示一些隱性的秘密。比如相對於好好說話，人們在出言諷刺時總會下意識地更多斷句，以及更愛使用問號、歎號。反諷的句子普遍比前者短50%，平均49.642 字構成一句。

又譬如，在正常評論中，平均每個句子包含0.398個問號，但在反諷的評論中，平均每個句子含有 0.773 個問號。

根據知乎提供的數據，6月份瓦力的“陰陽怪氣”識別能力上線後，在召回率 25% 的情況下，準確率達到了95%，有效折疊陰陽怪氣評論數量25995條。

算法的價值觀與邊界

知乎給了算法一個尺子，去選擇折疊什麽評論。

這把尺子，最早源於周源等創始人在2011年立下的規矩：認真、專業、友善——好的討論需要有討論意願，認真的態度，要求交流者有一定知識水準和專業能力，而不是泛泛的消遣，且交流過程要友善。

在宣泄和高效獲取知識上，知乎選擇了後者。這意味著一個職場新人去講職場成長可能並沒有老牌HR專業，沒有足夠知識儲備的音樂人去跨界強答科技話題，可能會被科技圈的人Diss：“不懂可以看，不要亂說”。

相對應的，算法基於這個原則折疊評論，但折疊也意味著未被平台認可的表達與宣泄被堵住了，伴隨著治理的可能是情緒和質疑。

孫達雲的艱難時刻在2011年至2013年。百度貼吧如日中天，網絡主流文化是灌水和屌絲，知乎天天被嘲諷，（你們管理員）做這些東西沒用。

“大家都覺得我們太較真了。說生活已經很艱難了，上網就是為了來噴人和發泄的。在知乎禁止的謾罵，然後用戶就去其他平台噴我們。直到最近兩年大家都不認為發泄是天然正確的，各家的底線都抬高了。”

在言論自由和社區價值觀中尋找平衡點，是社區的挑戰，但更難的問題是，如何平衡言論自由與社會倫理的價值判斷，人們喜歡在知乎上討論熱點，因此這種選擇幾乎每天都隨著熱榜出現在管理員的討論中。

在人工給出原則前，這是算法解決不了的超綱題。

知乎內部曾爆發過一次激烈的爭論。一名用戶在社區提問：娶媳婦是不是該娶處女？最熱的答帖稱，談戀愛一定要跟非處女，結婚找處女。這成了當時爭議最大的帖子。

究竟該不該封帖，知乎的全部核心成員擠在三層的會議室裡，誰也說服不了誰。正在外地的周源，通過一通電話把決定權給了給孫達雲。後者站在知乎的陽台上悶頭轉悠了很久，轉身回辦公室寫了篇公告——因為涉嫌對非處女人群的歧視，用戶被封禁了。

到今天，人工會去定義具體的特徵：比如性別、種族、身體特徵、膚色可能涉及的歧視，以及定義封建迷信的邊界，然後算法依據這套標準來甄別執行，提高社區的運營效率。

更好的分發與連接

2017年，李大任被挖來知乎擔任技術副總裁，負責搜索、內容推薦和AI模型。彼時知乎的用戶量還沒過億，但處於快速擴張期，傳統的社區管理手段已經失效。

各種新的問題出現了，比如提出一個問題應該找誰來回答？相對於隻包括200名互聯網大V的封閉階段，人和人之間是陌生和低粘性的；又比如，當用戶量擴大，敏感和低俗的內容不可避免的流入社區，知乎需要對每天新增的十幾萬條資訊做識別；再比如，新用戶進入社區，會帶來新的興趣，當新老用戶話不投機，或老用戶發現志同道合者越來越困難，對社區的依賴性就會被削弱。

知乎迫切需要用AI去提升運營效率。這不僅包含社區氛圍治理，還需要更加個性化地分發資訊，更準確的用戶分層，建立一個智能社區。

而如何根據興趣讓用戶分層、建立人與人之間的聯繫，在知乎是個有趣的話題。

李大任曾經問周源，為什麽知乎網友願意把自己的知識無償的拿出來分享，畢竟分享的成本不低。周源用一個例子回答了他：一個飯桌上有10個人，互相之間不認識，在這樣的飯局裡，讓其他人識別你的往往是你的專業，當有人聊起你的專業話題，你可能就會想介入多聊兩句。

按照周源的這種說法，根據不同的興趣劃分，知乎上如今有27萬個話題，從互聯網網科技、到財經商業、心理學、娛樂、體育、旅遊等。但僅根據興趣領域來給用戶分層，並基於此分發資訊，還遠遠不夠。

“事實上對不同知識結構的用戶，也需要有合理的區分。比如你是業餘天文愛好者，我給你推薦一篇非常專業的文章，你會看不下去。但如果你很專業，我給你推送科普文，你會覺得平台推送太水了。又或者有的人不是很專業，在一個很懂行的人的文章下面評論，作者可能覺得前者不懂裝懂，那麽兩邊都會受到傷害。”李大任對36氪解釋稱。

在你看不見的後台，機器用一套權重體系定義著你在各個領域的專業程度。不過用戶的認識水準和知識結構可能隨著時間變化、更新，因此知乎的算法也需要實時追蹤用戶的水準。

一套專業的興趣探測模型會承擔這個任務。比如當機器給用戶推薦了一次專業性很強的文章，你點擊、收藏或評論就屬於體現了興趣的正向反饋，如果反饋，可能就會過一段時間再做類似推送嘗試。

同時，在知乎這座虛擬城市中，每兩個居民之間會基於興趣偏好、個人在知乎的行為以及社交關係的向量，被計算出一個親密值。親密值的範圍在負一到正一之間。知乎算法會計算兩個陌生人之間產生連接的概率，然後通過推薦等手法讓他們相遇。但當用戶之間爆發過謾罵衝突，親密值偏向於負一一極，算法就會盡量降低他們相遇的概率。

而當兩個親密值高的用戶之間出現諷刺和調侃，未必會被機器定義為陰陽怪氣做處理，這就像日常生活中真正親密的好友，會出現善意的互損。

孫達雲至今還記得成都場“陰陽怪氣”一進門那股火鍋底料味兒。它來自門口一副用密密麻麻的辣椒鋪成的巨大的 “能杠”二字，字形粗曠。

製作它的藝術家，事先跑去菜市場買了兩麻袋辣椒，混和著火鍋底料，用膠水粘在寫好的字形上。熱辣辣的辣椒糊在手上生疼，就像平時發帖別懟的火氣從心裡移到了手上。

這幅字掛了半個月，辣椒逐漸劈裡啪啦往下掉，最後隻留下描著字形的淡淡的影子。

這是個隱喻。但願知乎裡那些“杠”和“懟”也是這樣。

標星36氪，每天獲取圈內最新資訊

成為進階互聯網人