Google強化智能回復功能，已可支持YouTube評論

公開日: 2020-07-02

Google現在將原本應用在Gmail和Android上的智能回復功能（Smart Reply）擴展到YouTube Studio上，供創作者能夠更方便地與觀眾互動。目前這項功能還隻支持英文和西班牙文，但Google提到，由於使用單一跨語言的模型，因此能夠簡化擴展至其他語言的過程。

智能回復是運用人工智能技術，產生回復消息建議選項給用戶，用戶能夠直接使用或是修改，以快速回應來訊，Google提到，由於YouTube創作者會在視頻下收到大量的回復，而且觀眾可能來自不同的社群，智能回復功能協助創作者回應觀眾的評論，以及進行討論等互動

不過，應用在Gmail和Android的智慧回復模型並不能直接搬到YouTube上使用，因為電子郵件的用語通常更為正式嚴謹，YouTube的評論存在更複雜的語言切換模式，並大量地使用表情符號，且觀眾對縮寫、慣用語以及標點符號使用習慣不一致，這些原因都讓Google在YouTube中添加智能回復功能充滿挑戰。

最一開始Google在Inbox應用程序中提供的智慧回復，是使用遞歸神經網絡逐字對輸入的電子郵件進行編碼，並使用另一個單詞等級的遞歸神經網絡以解碼可能的回復，Google提到，這種方法的計算成本很高，因此後來Google設計了一個檢索系統，通過搜索預先定義的建議列表，找出最適當的回應，就能以更少的計算達到相同的功能。

這個檢索系統讓Google得以將智能回復功能擴展到Gmail，並且也成為了當前YouTube中智能回復的基礎，不過，過去的智慧回復系統依賴單詞等級的預處理，這種方法只在有限的語言以及較嚴謹的寫作風格有用，但YouTube中存在太多表情符號、ASCII藝術和語言切換等異質內容，因此Google決定在YouTube使用案例中，不在編碼文本前進行任何預處理，而研究也證明，Transformer網絡能夠對字元長串行進行建模，並獲得與基於單詞的模型相同的品質。

雖然這個初步結果，對於處理帶有表情符號或錯字的評論，有很不錯的性能，但是因為Google是以字元長串行直接進行建模，比單詞還要長得多，因此運算也更複雜，使得模型預測速度無法用於生產環境中，後來Google借鑒信號處理模型WaveNet中的膨脹技術，在神經網絡的每一層都縮短一點字元串行長度，最終在運算速度和品質中取得平衡。

Google沒有為每種語言都訓練單獨的模型，而是訓練一個跨語言的模型，Google提到，單一跨語言模型能夠更好地處理YouTube評論中語言混用的情況，並使得模型能夠利用一種語言中常見的元素，來理解另一種語言，而且隻用一個模型，就能夠簡化維護和其他後續的工作。

目前這個模型已經能夠支持英文和西班牙文，但是其靈活性也能夠擴展支持其他語言，這種特性在Google還沒用平行語料庫訓練模型就已經出現，把模型對英文評論“這是一個很棒的視頻”的回復進行分群，阿拉伯文、英文和西班牙文相近的回復，在圖表的距離相當接近，不同語言但意義相似的回復，會在圖表中出現跨語言的聚類。