每日最新頭條.有趣資訊

阿里AI智能音箱現在有了視覺能力,跟人互動時表情豐富

安妮 發自 751D·Park

量子位 出品 | 公眾號 QbitAI

今天下午,阿里巴巴人工智能實驗室推出了第二代中文人機交流系統AliGenie 2.0,在“聽”和“說”的基礎上引入了視覺能力,搭載AliGenie 2.0的“精靈火眼”功能也同時亮相。

此外,天貓路由、天貓魔屏S1和天貓精靈曲奇三款新品也一同上市。

阿里AI智能音箱現在有了視覺能力,跟人互動時表情豐富

阿里AI實驗室負責人淺雪在發布會現場

AliGenie 2.0

人機互動不能僅僅局限在語音上,阿里AI實驗室負責人淺雪想讓人機互動的方式更多樣。

今天推出的AliGenie2.0就具備了視覺的能力,能夠進行視覺認知、多模態互動、情景感知。

阿里AI智能音箱現在有了視覺能力,跟人互動時表情豐富

AliGenie 2.0首先將視覺能力落地在天貓精靈X1上,通過搭載天貓精靈手機APP實現“精靈火眼”功能。

此外,阿里AI實驗室還推出了一個可以戴在天貓精靈X1頭上的“帽子”XHolder,以便將手機放在XHolder支架上捕捉影像,同時手機還會顯示出一對大眼睛。

阿里AI智能音箱現在有了視覺能力,跟人互動時表情豐富

天貓精靈X1+XHolder+App精靈火眼

對了,XHolder目前售價為49.9元。

阿里AI智能音箱現在有了視覺能力,跟人互動時表情豐富

XHolder外觀

核心功能

精靈火眼的核心能力有兩個:“視覺認知”和“表情系統”。

表情系統是指基於3D虛擬形象,提供自然互動的表情擬態動畫,目前包括近20多種擬態動畫,觸摸虛擬形象的不同部位,能夠產生反饋和互動,使用戶體驗從天貓精靈的語音互動更新為“精靈火眼”的自然互動。

阿里AI智能音箱現在有了視覺能力,跟人互動時表情豐富

視覺認知主要面向兒童,精靈火眼通過影像識別,結合智能語音互動、聲音朗讀,幫助兒童讀書、識字。

目前,阿里AI實驗室已經聯合中國少年兒童出版社、安徽少兒出版社等國內頂尖的出版社,選擇了適合3歲到8歲兒童的117套圖書,兒童只需將繪本展示給天貓精靈,即可聽到有聲版的故事。

阿里AI智能音箱現在有了視覺能力,跟人互動時表情豐富

此外,老年人也是精靈火眼的一大閱聽人。阿里AI實驗室開發了識別藥盒的功能,與阿里健康合作,能夠識別4萬種藥盒,覆蓋中國家庭常用藥,只要用精靈火眼掃一掃藥盒,就能用語音播報藥名、功效、過期日等資訊。

未來,阿里AI實驗室還將計劃引入萬物識別、人臉識別等功能。

“我們今天推出的精靈火眼功能,也只是視覺功能的開始。”阿里人工智能實驗室產品總監釋空在接受采訪時說。

這裡還有一個插曲。

在現場演示精靈火眼功能時,天貓精靈還一度沒有聲音,只有兩隻大眼睛做著各種各樣的變輕。在程式員“祭天”回來的二度展示時,聲音才恢復正常。

新品三連發

除了精靈火眼外,此次發布會還推出了阿里AI實驗室的三款新品。

天貓路由售價199元,是一個“沒有觸角”的路由,天線為隱形設計,不同Wifi熱點之間無縫切換。

阿里AI智能音箱現在有了視覺能力,跟人互動時表情豐富

天貓魔屏S1是一個可以聯合天貓精靈聯合使用的投影儀,最大投射螢幕300吋,售價4699元,以後在家裡就能享受巨幕效果了。

阿里AI智能音箱現在有了視覺能力,跟人互動時表情豐富

天貓精靈曲奇是個Q版的智能音箱,身高只有天貓精靈X1的一半,目前預售價為299元。

阿里AI智能音箱現在有了視覺能力,跟人互動時表情豐富

可以發現,這三款新設備,剛好是人機互動的“輸入設備”,“鏈接設備”以及人機互動的“輸出設備”。阿里方表示,輸入/連接/輸出的智能化這是AI實驗室對智聯網的三個關鍵組成部分的理解。

“我們生活在一個工業時代跨度到數字時代的過程,我們今天可能沒有辦法改變一個藥盒的外觀,但是我們可以改變一個藥盒的瀏覽方式,這就是人工智能實驗室想為我們這個世界帶來的一點點愛。”淺雪說。

— 完 —

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

獲得更多的PTT最新消息
按讚加入粉絲團