每日最新頭條.有趣資訊

疫情期間,你的網購數據其實被 “汙染” 了

人們在新冠大流行期間的反常行為,給人工智能模型帶來了麻煩,這些使用正常行為數據進行訓練的機器學習模型的弊端正在顯現。

據《麻省理工科技評論》報導,由於疫情快速席卷歐美,2020 年 4 月 12 日至 18 日,亞馬遜十大熱搜關鍵詞分別是衛生紙、口罩、洗手液、廚房用紙、來蘇爾消毒噴霧、高樂氏濕巾、防毒面具、來蘇爾、防菌口罩以及 N95 口罩。

專為亞馬遜商家提供算法廣告服務的、Nozzle 公司首席執行官雷爾 · 克萊恩(Rael Cline)說:“五天之內就發生了這種轉變,簡直難以置信。”

圖 | 橫坐標為時間,從左到右國家分別是意大利、西班牙、法國、德國、英國、墨西哥、加拿大、美國,熱詞包括口罩、洗手液和消毒劑等(來源:Nozzle)

如圖所示,意大利最先出現購買高峰,這也符合新冠病毒在歐美的暴發趨勢。用戶搜索習慣的改變,如同海鷗振翅可以改變氣象一樣,很快波及到供應鏈層面。

和中國的淘寶、京東等電商網站一樣,亞馬遜也在用推薦算法,來預測用戶感興趣的產品。

在亞馬遜上,多數店家的售賣模式,都是先把自家貨物,存放在亞馬遜倉庫,如果用戶從亞馬遜購買商品,商品物流、送貨到家和退貨處理等,都是亞馬遜負責。並且,亞馬遜還會給使用其物流的訂單,做大力度推廣。

比如當你搜索任天堂遊戲機時,出現在頁面最上方、並且靠近 “添加購物車” 按鈕的,最有可能的就是使用亞馬遜物流的商家。

據了解,為應對變化,亞馬遜目前的算法,更傾向於推廣使用自家物流的商家。並且亞馬遜也在對算法進行微調,為的就是分散系統壓力。

對此,娛樂向機器學習解說選手、《機器學習算法的數學解析與 Python 實現》作者莫凡告訴 DeepTech,他的第一反應特別 “程序員”,這不是 Bug,這是 Feature。推薦算法有這樣的結果,其實是“合理” 的,因為疫情中的用戶,最關心的就是疫情。由於推薦算法的主要功能是發現興趣,而此時用戶對於疫情的 “興趣” 大大提升,所以推薦算法才會推薦大量疫情相關的產品或服務。這便是近年來在互聯網中,越來越明顯的頭部效應。

事實上,亞馬遜的熱搜產品發生變化,並非個案。疫情期間,很多使用推薦算法服務的公司,大多概莫能外。

印度一家醬料和調味品公司,在疫情期間湧進大量訂單,推薦算法因此陷入崩潰,原因是該推薦算法,從未接受過如此大量的數據訓練。

一家通過 AI 來評估新聞走向,並根據結果、給客戶提供投資建議的公司,因為當前新聞越來越消極,推薦算法給出的建議,也逐漸失準。

而疫情肆虐,也讓部分網站,變得更加謹慎。

Phrasee 是倫敦一家從事 AI 行銷的公司,為避免生成的廣告,讓本就處於抗疫焦慮的用戶心理 “火上澆油”,他們把原本可以作為廣告詞的“如病毒般迅速傳播”“我的老天” 等易導致恐慌的詞語,進行了手動刪除。

或許你不是亞馬遜用戶,但你應該用過國內電商 App。

如果你也是天貓用戶,不妨打開 App,看看下圖中藍色虛線部分,系統推薦給你的八樣商品是什麽。

如下圖所示,用戶 A 和用戶 B,收到的產品推薦完全不同。

圖 | 天貓 App 個性化推薦(來源:Multi-Interest Network with Dynamic Routing for Recommendation at Tmall )

這便是推薦算法的典型案例。採訪中,莫凡舉了一個例子。

從喝可樂到推薦算法

假設熊大喜歡喝可樂,它天天去便利店買可樂,店長很快就知道它對可樂感興趣,這是第一次關聯。熊大付款後,店長想起熊二也愛喝可樂,這是第二次關聯。但熊二的不同之處在於,他每次買可樂,還要再買袋薯片,這是第三次關聯。

此時,店長覺得:既然它們都愛喝可樂,那沒準也都喜歡吃薯片。於是,熊大再來買可樂時,店家跟它推薦了薯片。這便是基於興趣的推薦算法。

它和大數據分析常說的 “啤酒尿片” 案例是一個道理,超市把啤酒和尿片放一起,是因為很多買啤酒的父親,會順手給孩子買尿片。

如今,電商網站普遍使用推薦算法,是因為相比推薦引擎,其不再是發現信息,而是發現興趣,即依靠人和物的關聯關係,最少只需三次關聯,就能完成興趣發現,從而進行信息推薦。

這樣看來,似乎推薦算法很智能,但好比夏天女生用的遮陽傘,並不一定適用於台風氣象一樣。看似聰明的推薦算法,在疫情期間已經出現失靈。

為何會算法失靈?

對於算法推薦為何會失靈,Hulu 全球研發副總裁、《百面深度學習》主編諸葛越分析稱,算法失靈主要有兩大原因。一是因為基於數據的推薦算法模型(以下稱“算法模型”),難以應對外部事件引起的用戶行為突變。二是算法模型的預測對象,也在發生劇變。

原因一:用戶行為突變

算法模型,需要利用歷史數據來訓練。所謂訓練,即通過大量經驗數據,擬合出從歷史行為模式、到未來行為傾向之間的映射。當用戶的行為模式發生驟變,比如突然購買 N95 口罩等冷門產品。而這種行為模式,在過往訓練數據中,很明顯沒有經過充分表達。因此,當疫情期間的推薦算法模型,仍舊按照歷史行為模式輸入,其輸出的預測,可能會有錯亂。

原因二:預測對象突變

疫情期間,算法模型需要預測的對象,即用戶的實際購買傾向,也已發生變化。算法模型能否快速適應用戶的特殊傾向,同時又不完全淹沒掉用戶在疫情以外的正常傾向、如換季買新衣服等,也跟訓練數據的采樣、特徵工程和模型結構有關。當一個集體且劇烈的行為模式突然而至,常規自動化算法建模流程很難做出應對,因此會出現一定程度的算法失靈。

那麽,算法失靈之 Bug,是否有解?

諸葛越在採訪中表示,解決上述困境,可以從四方面著手:

四大招,搞定算法失靈

調整訓練數據:針對疫情期間的數據模式突變,平台方需要在訓練數據的采樣上,平衡疫情期數據和非疫情期數據的比例。

調整特徵工程:根據數據洞察以及生活常識,增加一些針對性的特徵,例如商品送達時間,就是用戶在疫情期間,是否選擇某一商品的決定性因素。

調整模型結構:可以使用一些相對強壯(Robust)的模型結構,來應對疫情期間的數據突變。

針對性處理:一些邊角案例,有時需要手動來做針對性處理,例如不要推薦 “Viral(病毒的)” 等字樣。

算法失靈的孿生姐妹——算法失準

疫情期間的算法失靈,屬於短期事件。普羅大眾面對更多的,則是推薦算法的過度使用。

莫凡也向 DeepTech 分享了一個案例,他說,如果你是一位 B 站用戶,就會發現,越是頭部 UP 主,其內容就越容易被推薦給用戶,越推薦他就越佔據頭部,最終推薦算法導致的這種螺旋上升,也讓頭部效應更加明顯。

這種推薦,其實是基於點擊量來做推薦。但很多平台發現,基於點擊量的推薦,沒法體現用戶差異化的興趣。於是,類似前文的 “熊大熊二喝可樂吃薯片” 的興趣推薦,開始廣泛鋪開。

記者在使用某生活方式 App 時,就曾遇到興趣推薦,比如因為換季需要,在該平台上搜索涼鞋購買攻略,儘管隻搜過一次,但後續再打開該 App,首頁仍會推薦涼鞋攻略。

隔天,記者在該平台搜索裙子,首頁又開始推薦裙子。如果不重置搜索關鍵詞,似乎首頁推薦的,永遠都是近期閱讀的同類別內容,這就會導致信息繭房,即機器判斷你需要這一信息,但其實你的需求時效性,已經過期。

圖 | 因記者搜索過裙子,再次打開該 App,排行第一的推薦依然是裙子

算法推薦,能在當下遍地開花,一定有其必要性。但不應僅有興趣推薦。基於內容的推薦如“看過這個視頻的觀眾還看過”、以及基於地理位置的推薦如“同城的觀眾都在看”,也應該納入推薦範圍內。如此,才能滿足不同用戶的“胃口”,讓大家各取所需,而不是點開後大呼浪費流量。

-End-

獲得更多的PTT最新消息
按讚加入粉絲團