智能語音助手+全息形象，會是下一個趨勢嗎

現在，智能語音助手已經無處不在，手機、音箱、電視、汽車裡都能尋得他們的蹤跡。他們都有一些相似的點：能識別語音、說喚醒詞就能開始對話、可以完成人們的各種指令，除了內在技能以外，在外表上，他們目前也都沒有能直接互動的可視化形象。

在雷鋒網看來，打造一個能互動的可視化智能語音助手，或許是智能語音助手發展的下一步，也可能成為各個致力於互動式人工智能公司體現差異化的地方。

和二次元老婆一起生活

7月31日，即時通訊巨頭Line推出了擁有全息形象的智能助手——全新版本的Gatebox，旨在為用戶提供家人般的陪伴。

Gatebox的外觀接近小桌燈大小，玻璃外殼，利用全息投影技術在玻璃內呈現出一個名為Hikari Azuma的二次元人物。

Gatebox這款產品看起來天生就是為日本宅男設計的，用一個玻璃盒就可以把自己的二次元“老婆”養在家裡。

演示影片也彌漫著一股單身宅的氣息。

第一個畫面，“宅男”在公司加班，Hikari Azuma通過Line發去了消息，“你記得今天是什麽日子嗎？什麽時候回來？”

“宅男”說，“馬上回來！”

Hikari Azuma：“好棒！”，隨手打開了家裡的燈，等待主人回家。

“宅男”回家後，Hikari Azuma立馬甜蜜問候：“歡迎回來。”然後羞答答地說：“今天是我們住在一起三個月紀念日，你記得嗎？”

“宅男”立馬拿出了禮物，Hikari Azuma看到之後開心地鼓掌。

“宅男”準備好食物和酒，開始慶祝時，Hikari Azuma把家裡的燈光系統調節成了溫馨浪漫的風格。

最後，“宅男”和Hikari Azuma舉起酒杯，互相感謝對方的陪伴。

影片最後的一句話寫著：Living with characters(和二次元老婆一起生活)。

恩，看完影片，雷鋒網編輯感受到，霓虹國在關愛宅男方面，真的是很有建樹了。

從影片中男主人與Hikari Azuma的互動來看，Hikari Azuma具備文字對話、語音識別、視覺感知等多模態的智能。據外媒報導，舊版的Gatebox需要按實體鍵才能進行對話，新版Gatebox-100可以直接說喚醒詞。而視覺部分則是通過外設的攝影頭和傳感器實現。

很遺憾，目前雷鋒網編輯還沒有一手體驗，無法獲知Hikari Azuma的對話能力究竟如何，是否能實現連續的對話能力。

Line的智能語音助手布局

Line這家公司為何要做Gatebox這樣的產品呢？

Line是韓國最大的網絡運營商Naver Corp的子公司，其用戶數已經超過2億。除了即時通訊外，Line還有支付、音樂、遊戲等垂直業務。如今，互聯網巨頭蘋果、Facebook、亞馬遜都在做智能語音助手，Line進軍這個行業也是順理成章。

去年3月，Line發布了一款名Clova的智能語音助手，然後推出了多款智能音箱，有Clove Wave、Champ、Face還有Clove Friends。

而Gatebox最初是由日本公司Vinclus開發，2016年曾推出限量300台，售價30萬日元。2017年，Line收購了該公司的多數股權。

現在，Line推出大眾市場版本的Gatebox-100，售價降低到15萬日元（大約人民幣9112元），不過拒說想要和“老婆”生活，每個月還需要交納1500日元的生活費，不然老婆就要打包走人了。原來虛擬的老婆也是要養的。

但是，令人驚訝的是，Gatebox-100現在並沒有搭載Line的人工智能助手Clova。Line表示不久之後，Gatebox就會與Clova集成，可以獲得Clova更多AI技能，包括與第三方服務的更深層次集成。

在雷鋒網看來，不知道是否是因為將Clova與Gatebox集成需要很大的研發精力，而Line又不確定Gatebox這種小眾路線的產品是否能獲得足夠的市場。

智能語音助手如何可視化

除Line之外，雷鋒網發現還有不少公司在探索智能語音助手可視化之路。

三星也在研發類似Gatebox的產品。今年4月，在SXSW 2018展會上，三星推出了一款新型智能音箱原型產品，名為Aurora。三星Aurora智能音箱沒有麥克風、處理器，甚至任何其他智能的組件，而是採用了可放置兼容智能手機的底座，需要把手機放進去，才能使用。顯示屏能夠投影出一個全息式的動畫角色。

還有微軟。

7月26日，微軟小冰更新到第六代，她才終於有了3D形象，以前，只是一張看不太清楚長相的二維頭像。

在此之前，或許是技術不成熟，又或許是打擾不同的人會對智能助理的外觀有不同的要求，小冰一直沒有具體的形象。經過四年的發展，小冰從一個活躍在QQ和微信裡純粹的聊天機器人進化成為能寫新聞、主持節目、寫詩、唱歌、講故事、識別影像的多才藝智能助理。VR和AR等技術也日趨成熟，視覺的3D化是大勢所趨。至少有了3D的形象，小冰就可以靠顏值去主持更多的電視節目。

微軟HoloLens團隊也多次表示，MR是視覺，AI是大腦，AI與MR的融合是必然。例如以後微軟小冰、小娜都會有3D的形象，你帶上眼鏡就能直接看到3D的小冰、小娜。

小冰從一開始定位為聊天機器人，就很注重對人類的陪伴，這一點與Gatebox的定位其實是一致的。對陪伴式機器人來說，擁有可視化的外形會是加分項。

我們也看到，在小冰擁有3D形象之前。已經有網友自己製作出了微軟小娜的全息互動裝置。

這名愛好者名叫Jarem Archer，2017年5月，他在網上放出了一段影片，展示與全息Cortana之間的互動。整個裝置都是他自製的，用Unity 3D製作動畫效果，用Kinect實現動畫動作，然後還採用了面部跟蹤來讓Cortana一直面朝說話者。

雷鋒網也設想，除了Gatebox這樣一個專門全息展示裝置之外，我們也可以通過其他的技術手段使得現在搭載智能語音助手的硬體也能有3D的形象。例如，利用手機AR，手機裡的智能語音助理就可以有3D形象，在用戶需要的時候被召喚出來，手機的攝影頭也可以識別人的動作和表情，幫助智能語音助理獲得視覺的部分。智能音箱則獲取可以依賴投影技術，向外投射出智能助理的形象。

雷鋒網也了解到，目前還有其他的專注於互動式人工智能的公司在探索智能語音助理的可視化，放置在公共場景，例如咖啡廳、麥當勞等場所，作為服務生幫助用戶點餐，陪伴用戶等餐。

那麽，為什麽現在都還沒有成熟的方案呢？

目前，對話式人工智能技術在不斷成熟，Google Assistant已經能夠打電話給餐廳幫用戶預訂位置，而服務生甚至無法辨認出對方是機器人。微軟小冰也已經能夠與人類通電話，能了解對方的情緒狀態，還能安撫對方的低落情緒。但是，這都是在文字、語音對話的層次上面。

可以想象，如果智能語音助手有了可視化的、具體的形象，人們在與其交流時，會給出更高的心理預期，期待更自然、更多互動的對話。在純文字和語音時，如果智能語音助手聽不懂人類的語音、回復很慢、回復完全風馬牛不相及，似乎還能原諒。要是有了一個可視化的形象，這樣似乎只會顯得很傻。有著完美形象，但是卻時常無法與之進行正常的交流，會很氣人吧。

像Gatebox這樣走的是宅漫風格，能把全息“老婆”帶回家，就已經能滿足很多人，或許能彌補互動上的問題。除了Line這樣的方案以外，雷鋒網好奇，還會有什麽樣合適的場景呢？