每日最新頭條.有趣資訊

美團AI實戰:迎接外賣個性化場景中的挑戰

大數據文摘出品

記者:張馳

繼今年4月O’Reilly AI Conference在紐約落下帷幕之後,6月18-21日,O’Reilly AI Conference來到北京。這次的 AI 盛會由 O'Reilly 和 Intel AI 聯合舉辦。大會通過培訓、輔導課和主題演講等多種形式,探討和分享了AI 技術在實際生活中的落地應用。

大數據文摘作為特大約作媒體也參與了這一盛會,文摘菌此次收獲頗豐,趁熱打鐵先來帶著大家看看第一天的報告吧:

迎接外賣個性化場景中的挑戰

來自美團的研究員劉懷軍分享了關於AI技術在外賣個性化場景中的落地與思考。

外賣的4個個性化場景分別是智能搜索,場景推薦,附近推薦,和智能導購。要實現個性化面臨的問題主要是,外賣的菜品相較於電商商品,缺少完備的知識圖譜,信息量少,數據挖掘難度大。

另外外賣的鏈路很長,從用戶瀏覽下單,再到平台發單給商家,商家接單後出餐,最後通過騎手將外賣配送到用戶,包括的主體角色有用戶,商家,騎手以及中間平台,因此外賣過程中不確定因素多,需要保證鏈路過程的各角色的多目標均衡。

而且現在外賣平台已經不單單是隻供給用戶飲食的平台:買藥,買鮮花,買生鮮等更多的需求促使外賣發展成為一個更綜合的外賣平台。從美團外賣單天訂單趨勢圖可以看出每天的外賣訂單存在高峰時段,這就要求平台能夠做出及時的決策,保證高時效性。

外賣個性化中存在的這些問題,需要通過資源配置,來實現用戶需求和商家供給的精準匹配。對應的需要解決的AI技術問題為:以知識圖譜為基礎建設,針對有明確需求的用戶,為其提供智能搜索,對於非明確需求的用戶提供智能推薦。

以知識圖譜為基礎建設

目前行業內,包括Google,微軟,亞馬遜,facebook等企業都構建著百億級知識圖譜。美團外賣目前擁有超過300萬的商家入駐,有4億+的商品和超過3億的用戶,構建知識圖譜是十分有必要的,也是十分具有挑戰性的。

美團提出的知識圖譜的構建方案包括整合多源(外賣,團購,點評),異構(文本,圖片,行為)數據,采取不同的模型進行多技術融合,並通過用戶反饋和商家運營等輔助知識圖譜的構建。其中涉及的技術包括圖像識別,多源數據處理,以及構建語義模型,圖像模型和異構混合模型。

劉懷軍說:技術的發展會遇到局限,產品的發展也會受到局限,但是技術和產品的結合能突破產品的局限和技術的局限。

智能搜索與智能推薦

針對有明確需求的用戶,美團希望做的為其提供智能搜索。搜索技術面臨的最大挑戰包括文本匹配與語義匹配的問題,但是更加關注的是語義匹配的問題,劉懷軍依次介紹了BM25算法,DSSM等語義匹配模型來解決這一問題。

針對需求不確定的用戶,要做到多層級的智能推薦:商家推薦,商品推薦,套餐推薦,主題推薦。推薦的過程要覆蓋全鏈路,全品類,多場景。全鏈路要保證用戶從進入平台開始點菜一直到下單後的推薦;全品類要包括美食,超市,蔬果,甜點,飲品等各種類別;多場景要負責不同時段,不同地點的推薦。

對此劉懷軍介紹了基於時序模型的實時推薦技術,利用LSTM記錄用戶的長期偏好和實時的短期偏好,通過長期與短期結合實時預測;利用ESMM模型的多目標優化,解決多目標均衡的問題;最後利用知識圖譜+情感分析挖掘評論中的推薦理由,以及利用知識圖譜+注意力模型生成推薦理由。

劉懷軍認為美團外賣未來會進行智能驅動,充分結合AI的優勢,來解決外賣個性化推薦的問題,以及利用強化學習進行全鏈路的全局優化,保證每一環節都能達到最優的平衡,帶來外賣領域的革命性成果。

AI“美顏”你的歌聲和視頻:K歌修音和自動作曲

來自Kwai的音樂檢索(MIR)技術專家薑濤分享了用AI來美聲的有趣的研究。

薑濤在報告現場首先展示了其公司成員一段清唱的災難現場,然後展示了經過AI美音後得到的標準好聽的歌唱版本。

由於歌曲原唱的清唱版本在各大公司處作為保密文件,不易獲得模型訓練的真實標簽,是該技術發展的一大瓶頸。

其公司利用MP3等包含背景音樂的原唱歌曲,通過分離技術將歌手清唱音頻和背景音樂音頻分離開,以此獲得歌手清唱音頻,再以此作為ground truth進行模型訓練。目前該公司的AI美音軟體在Server端和手機移動端均可做到一句歌詞的延遲水準,而且也可以做到對正常說話的內容進行美聲,具有遠大的前景。

放大招:TensorFlow 2.0新功能

本次大會演講中最讓文摘菌感興趣的是來自Google的高級工程師王鐵珍關於Tensorflow2.0的介紹。

廢話不說,直接上安裝方式:

王鐵珍介紹這是TF2.0的測試版,正式版將在今年發布。那麽TF2.0到底帶來了哪些好處呢?TF1.0又存在哪些缺陷呢?

首先,TF2.0推薦使用tf.keras作為高層級的API接口,keras是tensorflow的高級神經網絡接口,裡面有大量模型的封裝,高度模塊化並具有可擴展性,簡化了許多複雜算法的實現難度,可以減少開發的成本,TF2.0推薦使用該接口,可以看出深度學習的編程過程趨向簡單化。

其次,作為使用過Tensorflow1.0的朋友來說,其並不友好的靜態圖開發使得眾多開發者望而卻步。因此TF2.0使用了Eager Execution(動態圖模式),使其可以不用再構建完圖,通過sess.run來執行,而是可以像普通程序一樣直接執行,增強的可用性。這一功能可以說讓本來打算放棄TF轉向PyTorch的文摘菌又立刻充滿乾勁,然後激動地跟著谷歌爸爸繼續前進。

TF2.0變得更清晰了,去掉了一些複雜的API,如tf.app等,新的API的語法非常友好,並且能兼容Tensorflow的生態系統。

話不多說,來看一下新版的數字分類代碼:

可以看出和TF1.0相比幾乎沒有改變,體現出了很好的兼容性。

王鐵珍還介紹到,TF2.0提出了類的概念,以往TF1.0的編程過程都是面向過程,一個流程下來編寫的,現在加入了類的概念,引入了面向對象的編程方式。

但是問題來了,就算再兼容,用戶還要重新學習TF2.0的新語法規則,那多麻煩啊!別急,馬上就要放大招了!新版的TF2.0還提供了自動更新的代碼,能直接讓你的TF1.0代碼直接升級為TF2.0的代碼,只需要關鍵的一個語句:

另外,新版本中不會再有佔位符,session.run,feed_fict之類的麻煩了。

接著,王鐵珍介紹了應用在手機等移動端的TensorFlow Lite框架,在手機也能運行深度學習,文摘菌拿起自己的手機看了看,沉思了一會又默默地放了下來,手機跑深度模型用來幹啥呢?

報告結束前王鐵珍研究員還放出大招:提供了網頁瀏覽版的Tensorflow.js,這個網頁厲害就在於可以直接使用GPU運行程序,啥都不用安裝,什麽CUDA,CuDnn之類的當時裝Tensorflow-gpu的苦大家都懂的,所以這個網頁版的Tensorflow簡直深得人心。

會議還在繼續,關注大數據文摘獲得最新報導哦。

志願者介紹

獲得更多的PTT最新消息
按讚加入粉絲團