美團AI實戰：迎接外賣個性化場景中的挑戰

大數據文摘出品

記者：張馳

繼今年4月O’Reilly AI Conference在紐約落下帷幕之後，6月18-21日，O’Reilly AI Conference來到北京。這次的 AI 盛會由 O'Reilly 和 Intel AI 聯合舉辦。大會通過培訓、輔導課和主題演講等多種形式，探討和分享了AI 技術在實際生活中的落地應用。

大數據文摘作為特大約作媒體也參與了這一盛會，文摘菌此次收獲頗豐，趁熱打鐵先來帶著大家看看第一天的報告吧：

迎接外賣個性化場景中的挑戰

來自美團的研究員劉懷軍分享了關於AI技術在外賣個性化場景中的落地與思考。

外賣的4個個性化場景分別是智能搜索，場景推薦，附近推薦，和智能導購。要實現個性化面臨的問題主要是，外賣的菜品相較於電商商品，缺少完備的知識圖譜，信息量少，數據挖掘難度大。

另外外賣的鏈路很長，從用戶瀏覽下單，再到平台發單給商家，商家接單後出餐，最後通過騎手將外賣配送到用戶，包括的主體角色有用戶，商家，騎手以及中間平台，因此外賣過程中不確定因素多，需要保證鏈路過程的各角色的多目標均衡。

而且現在外賣平台已經不單單是隻供給用戶飲食的平台：買藥，買鮮花，買生鮮等更多的需求促使外賣發展成為一個更綜合的外賣平台。從美團外賣單天訂單趨勢圖可以看出每天的外賣訂單存在高峰時段，這就要求平台能夠做出及時的決策，保證高時效性。

外賣個性化中存在的這些問題，需要通過資源配置，來實現用戶需求和商家供給的精準匹配。對應的需要解決的AI技術問題為：以知識圖譜為基礎建設，針對有明確需求的用戶，為其提供智能搜索，對於非明確需求的用戶提供智能推薦。

以知識圖譜為基礎建設

目前行業內，包括Google,微軟，亞馬遜，facebook等企業都構建著百億級知識圖譜。美團外賣目前擁有超過300萬的商家入駐，有4億+的商品和超過3億的用戶，構建知識圖譜是十分有必要的，也是十分具有挑戰性的。

美團提出的知識圖譜的構建方案包括整合多源（外賣，團購，點評），異構（文本，圖片，行為）數據，采取不同的模型進行多技術融合，並通過用戶反饋和商家運營等輔助知識圖譜的構建。其中涉及的技術包括圖像識別，多源數據處理，以及構建語義模型，圖像模型和異構混合模型。

劉懷軍說：技術的發展會遇到局限，產品的發展也會受到局限，但是技術和產品的結合能突破產品的局限和技術的局限。

智能搜索與智能推薦

針對有明確需求的用戶，美團希望做的為其提供智能搜索。搜索技術面臨的最大挑戰包括文本匹配與語義匹配的問題，但是更加關注的是語義匹配的問題，劉懷軍依次介紹了BM25算法，DSSM等語義匹配模型來解決這一問題。

針對需求不確定的用戶，要做到多層級的智能推薦：商家推薦，商品推薦，套餐推薦，主題推薦。推薦的過程要覆蓋全鏈路，全品類，多場景。全鏈路要保證用戶從進入平台開始點菜一直到下單後的推薦；全品類要包括美食，超市，蔬果，甜點，飲品等各種類別；多場景要負責不同時段，不同地點的推薦。

對此劉懷軍介紹了基於時序模型的實時推薦技術，利用LSTM記錄用戶的長期偏好和實時的短期偏好，通過長期與短期結合實時預測；利用ESMM模型的多目標優化，解決多目標均衡的問題；最後利用知識圖譜+情感分析挖掘評論中的推薦理由，以及利用知識圖譜+注意力模型生成推薦理由。

劉懷軍認為美團外賣未來會進行智能驅動，充分結合AI的優勢，來解決外賣個性化推薦的問題，以及利用強化學習進行全鏈路的全局優化，保證每一環節都能達到最優的平衡，帶來外賣領域的革命性成果。

AI“美顏”你的歌聲和視頻：K歌修音和自動作曲

來自Kwai的音樂檢索（MIR）技術專家薑濤分享了用AI來美聲的有趣的研究。

薑濤在報告現場首先展示了其公司成員一段清唱的災難現場，然後展示了經過AI美音後得到的標準好聽的歌唱版本。

由於歌曲原唱的清唱版本在各大公司處作為保密文件，不易獲得模型訓練的真實標簽，是該技術發展的一大瓶頸。

其公司利用MP3等包含背景音樂的原唱歌曲，通過分離技術將歌手清唱音頻和背景音樂音頻分離開，以此獲得歌手清唱音頻，再以此作為ground truth進行模型訓練。目前該公司的AI美音軟體在Server端和手機移動端均可做到一句歌詞的延遲水準，而且也可以做到對正常說話的內容進行美聲，具有遠大的前景。

放大招：TensorFlow 2.0新功能

本次大會演講中最讓文摘菌感興趣的是來自Google的高級工程師王鐵珍關於Tensorflow2.0的介紹。

廢話不說，直接上安裝方式：

王鐵珍介紹這是TF2.0的測試版，正式版將在今年發布。那麽TF2.0到底帶來了哪些好處呢？TF1.0又存在哪些缺陷呢？

首先，TF2.0推薦使用tf.keras作為高層級的API接口，keras是tensorflow的高級神經網絡接口，裡面有大量模型的封裝，高度模塊化並具有可擴展性，簡化了許多複雜算法的實現難度，可以減少開發的成本，TF2.0推薦使用該接口，可以看出深度學習的編程過程趨向簡單化。

其次，作為使用過Tensorflow1.0的朋友來說，其並不友好的靜態圖開發使得眾多開發者望而卻步。因此TF2.0使用了Eager Execution（動態圖模式），使其可以不用再構建完圖，通過sess.run來執行，而是可以像普通程序一樣直接執行，增強的可用性。這一功能可以說讓本來打算放棄TF轉向PyTorch的文摘菌又立刻充滿乾勁，然後激動地跟著谷歌爸爸繼續前進。

TF2.0變得更清晰了，去掉了一些複雜的API，如tf.app等，新的API的語法非常友好，並且能兼容Tensorflow的生態系統。

話不多說，來看一下新版的數字分類代碼：

可以看出和TF1.0相比幾乎沒有改變，體現出了很好的兼容性。

王鐵珍還介紹到，TF2.0提出了類的概念，以往TF1.0的編程過程都是面向過程，一個流程下來編寫的，現在加入了類的概念，引入了面向對象的編程方式。

但是問題來了，就算再兼容，用戶還要重新學習TF2.0的新語法規則，那多麻煩啊！別急，馬上就要放大招了！新版的TF2.0還提供了自動更新的代碼，能直接讓你的TF1.0代碼直接升級為TF2.0的代碼，只需要關鍵的一個語句：

另外，新版本中不會再有佔位符，session.run，feed_fict之類的麻煩了。

接著，王鐵珍介紹了應用在手機等移動端的TensorFlow Lite框架，在手機也能運行深度學習，文摘菌拿起自己的手機看了看，沉思了一會又默默地放了下來，手機跑深度模型用來幹啥呢？

報告結束前王鐵珍研究員還放出大招：提供了網頁瀏覽版的Tensorflow.js，這個網頁厲害就在於可以直接使用GPU運行程序，啥都不用安裝，什麽CUDA，CuDnn之類的當時裝Tensorflow-gpu的苦大家都懂的，所以這個網頁版的Tensorflow簡直深得人心。

會議還在繼續，關注大數據文摘獲得最新報導哦。

志願者介紹