每日最新頭條.有趣資訊

亞馬遜不服谷歌 Alexa要支持8種自然語音

智東西(公眾號:zhidxcom)編 | 竭渴

智東西5月17日消息,亞馬遜今日開始將允許Alexa語音應用的開發者免費使用8種來自於Amazon Polly的自然語音,讓Alexa的語音應用程式能更具特色。這8種自然語音中,男女聲都有,全部採用美式英語發音。

(Alexa支持的8個自然語音)

一、自然語音?有多自然?

Alexa新擁有的自然語音,是通過Amazon Polly提供的。Amazon Polly是亞馬遜提供的基於深度學習技術將文本轉換為逼真語音的服務。

Amazon Polly支持語音合成標記語言 (SSML),它是一種基於XML的W3C標準標記語言,適用於語音合成應用程式,且支持使用通用 SSML標簽進行斷句、重音和語調。

簡而言之,Amazon Polly合成的語音有語氣和聲調的高低起伏、有語速的快慢交替,也會在講話的過程中適時的停頓斷句。

那麽,Amazon Polly是如何將它合成的語音發送到搭載了Alexa的智能設備上的呢?

Amazon Polly可以為開發者提供一個 API,借助此 API,開發者可以將合成語音快速集成到智能設備的應用程式中。開發者只需將要轉換成語音的文本發送到 Amazon Polly API,Amazon Polly便會立即將音頻流發送回應用程式中。有了這個API,開發者可以選擇讓用戶在應用程式中進行即時語音互動,或將 Amazon Polly發送回來的音頻流以MP3的格式儲存下來。

Amazon Polly支持的語音、語種不止8種,它可以提供幾十種逼真的語音並支持多個語種。此次亞馬遜僅向Alexa語音應用的開發者提供8種美式英語語音,或許是出於Alexa的很大一部分用戶目前集中於美國的原因。

(Amazon Polly支持的部分語音、語種)

二、亞馬遜為何要讓Alexa聽起來不一樣?

首先,讓Alexa能發出更多不同的聲音,有助於提升用戶使用Alexa的感觀,消除人與機器之間的距離感。例如,當小朋友使用Alexa,讓其讀故事時,不同的語音和起伏的語調會更讓小朋友有代入感。

其次,科技巨頭們為了抓住更多用戶,在技術應用上競爭激烈,亞馬遜此舉應該是回應谷歌上周於I/O大會上宣布Google Assitant將支持6種不同語音一事。谷歌I/O大會上,谷歌CEO Sundar Pichai向大家展示了Google Assitant上通過WaveNet合成的超自然語音,其中一個語音甚至來自於著名R&B歌手John Legend。Sundar Pichai說這是為了適應Google Assitan用戶各種不同的發音習慣。

可見,語音助手們為了獲得用戶的“芳心”可謂煞費苦心。我們是不是可以期待,有一天,語音助手能開口就對我們講出一口流利的四川話/東北話呢?

獲得更多的PTT最新消息
按讚加入粉絲團