每日最新頭條.有趣資訊

蘋果和Siri的七年之癢:Siri的落寞之路

蘋果和Siri的七年之癢:Siri的落寞之路

編譯:AI科技大本營

參與:王珂凝 編輯部

【AI科技大本營導讀】曾經,我們一度認為 Siri 將會是蘋果的下一個重大創新。 但在 Siri 推出七年之後的今天,它卻成了蘋果的“拖油瓶”。本文講述了 Siri 的落寞之路。

2011 年,庫比蒂諾總部,蘋果公司舉辦了 “Let’s talk iPhone” 新品發布會,那是一個歷史性時刻,是新任首席執行官蒂姆·庫克的第一次大型發布會。他試圖通過這次發布會來續寫史蒂夫·喬布斯的產品故事。 但令人失望的是,當時發布的不是一款全新的 iPhone 5,而是 iPhone 4 的更新版 iPhone 4s。

Siri 拯救了這場令人失望的發布會。 這款數字語音助理產品在發布會上所展示的對語音指令的響應能力,讓評論者驚歎不已。 它能夠通過指令自動創建提醒、預先設定日程活動或為用戶提供有關餐館或氣象的資訊。人們一致認為,它會是一種具有革命性意義的產品。這也間接助推了 iPhone 4s 的銷量,推出後短短三天內,蘋果就銷售了四百萬部手機,在當時,這是有史以來銷量最高的 iPhone。

如今,距離 Siri 發布已經七年了,它飽受詬病。根據分析師的早期推斷,Siri 是影響蘋果最新產品性能的主要原因——一款售價 349 美元的 HomePod 智能音箱。儘管這款音箱借其時髦設計和完美音質贏得了不少讚譽,但在測試之後,由於總是發出諸如“笨拙”、“煩人”和“尷尬”等詞,這讓蘋果最終放棄了音箱的 Siri 語音功能。

為了弄清蘋果在語音助理領域是如何打敗亞馬遜和谷歌等競爭對手的,The Information采訪 了十幾名蘋果的前員工,他們曾在不同的團隊中負責開發 Siri 或負責將其整合到蘋果系統中,絕大多數人匿名發表了他們的看法。

前員工發表他們的看法並不常見。蘋果正努力重塑自我形象,除了硬體設計,也試圖致力於創新和提供高品質在線服務。它曾在在線服務業務,尤其是低品質的 iCloud 服務上摔過跟頭。隨著 iPhone 銷售量的逐年走低,在線服務也許會對蘋果未來的發展造成傷害。

在 Siri 技術尚未完全成熟之前,蘋果就決定要將 Siri 嵌入 iPhone 4s 系統中,上述很多前員工表示,這在內部立刻引發了一場激辯:是否繼續修補有缺陷的架構?還是將其推倒重來?這場辯論自 Siri 發布以來愈加熱鬧。這場辯論只是個開始,Siri 的各個團隊更熱衷於參與小團體鬥爭,並就 Siri 的理想版本發表激烈爭論——它到底是快速準確的資訊獲取者?還是善於處理複雜任務的資訊助理?

這些團隊的勾心鬥角在長官者和中層管理人員之間你來我往,他們缺乏喬布斯的遠見和影響力。與此同時,噩耗傳來,喬布斯在蘋果推出 Siri 後的第二天因患胰腺癌去世。這些前員工表示,長官力缺乏和人員不斷流動使 Siri 重新陷入了困境。但導致其失敗的最主要原因是蘋果不對外開放的封閉文化,它未能給外部開發人員提供更多機會開發更多有用的 Siri 應用。

一直以來,Bill Stasior 負責管理 Siri 的開發部門, 他是一名安靜而謙遜的工程師,曾是亞馬遜傑出的搜索專家,隨後於 2012 年末加入蘋果。 Stasior 負責 Siri 的核心技術——語音識別系統、自然語言處理系統以及蘋果的各種搜索功能。 Siri 的前員工們表示,這些部門之間相互競爭是為了獲得更多關注和資源,並且部門之間也經常發生衝突。

蘋果發言人拒絕了讓 Stasior 接受媒體的采訪。在一份聲明中,他們宣稱 Siri 是“全球最受歡迎的語音助理”,並吹捧了它在蘋果設備上的強大能力。

“Siri 在性能表現、可擴展性和可靠性等方面已經取得了重大進步,我們採用了最新的機器學習算法使其具有更自然的聲音和更強的主動性,”蘋果在聲明中寫道。 “我們將繼續加大對機器學習和人工智能領域的投資,不斷提高 Siri 所提供答案的品質,也會不斷擴大 Siri 回答問題的範圍。”

可以肯定的是,沒有哪家公司能夠擁有像科幻電影裡那樣完美的數字語音助理,而蘋果的產品在某些領域確實領先於亞馬遜和谷歌:Siri 支持 21 種語言,而亞馬遜的 Alexa 隻支持 3 種語言;Google Assistant 則支持 8 種語言(谷歌上個月表示,Google Assistant 不久就會支持超過 30 種語言)。Siri 每個月在超過 5 億台設備上使用,每周則需要處理 20 億次問答請求。

和首次推出的 Siri 相比,現在 Siri 對指令的響應速度要快很多。而在用戶數量方面,由於 Siri 嵌入在了號稱蘋果最暢銷產品之一 iPhone 中,他們自信宣稱,使用 Siri 的用戶要遠遠超過其他語音助理。

儘管如此,與其競爭對手相比,Siri 的能力仍然有限。2016 年,蘋果推出了 SiriKit,這是一款能夠讓外部開發人員有機會為 Siri 開發新功能的工具,但可惜沒有極大吸引開發者的興趣。

與之相比,它的競爭對手亞馬遜 Alexa 則擁有 25000 個由第三方開發人員構建的“技能(skills)”。Google Assistant 則擁有 100 多萬種“行為(actions)”,其中包括谷歌寫入的命令(如通過谷歌地圖進行導航)以及由第三方開發的功能(谷歌沒有透露第三方開發的數量)。這些競爭平台在使用量上也在迅速趕上蘋果:谷歌 1 月份宣稱 Assistant 已使用在 4 億台設備上,而亞馬遜也表示僅在節假日期間,就已經賣掉了“數千萬”台基於 Alexa 的設備。

“當Alexa 出貨時,銷量從第一天開始就非常穩定,”一位前 Siri 團隊成員說。 “對於 Siri 來說,想要達到這一點,他們幾乎要推到重來。”

宇宙中的足跡

Siri 公司成立於 2007 年,由斯坦福研究院——一個位於門洛帕克的非盈利研究組織——負責這項技術的研究 。 Siri 最初的構想是成為一個智能數字語音助理:能對用戶請求作出響應並和用戶進行互動以獲取所需要的回答。例如, 理想情況下,Siri 並不會直接給出一個餐廳的電話號碼,而是通過溝通與用戶確認清楚細節,如日期、時間和參加派對的人數,然後直接自行預訂餐廳。

Siri 的設計者們認為,解決這一問題的唯一途徑就是創建一個開放平台,允許外部開發人員參與 Siri 的開發,這樣才能使 Siri 的功能數量遠遠多於“閉門造車”。

“這是一個關於為人工智能開發應用程式的問題,” Siri 的一位高管說, “它應該成為一種通過對話來協調互聯網的一種方法。”

Siri 公司創始人兼董事會成員 Norman Winarsky ,認為喬布斯是 Siri 潛力的忠實信徒。2010 年的某一天,喬布斯邀請 Siri 首席執行官 Dag Kittlaus 及該公司的三位聯合創始人到他的家中會面。數小時以後,喬布斯最終說服該團隊,摒棄其他合作者,全身心投入蘋果公司,並讓他們相信,他們將會在 Siri 上實現更大的目標。

“喬布斯極大地鼓舞了這個團隊,” Winarsky 談到 Siri 聯合創始人。 “他讓這個團隊所有人都相信,他們可以在宇宙中留下自己的足跡。“

2010 年 4 月,蘋果以超過 2 億美元的價格收購了 Siri 。 當時, Siri 只有24名員工,但蘋果很快擴充了 Siri 的核心團隊人才。18個月後,Siri 和 iPhone 4s 一起推出,Siri 的團隊已經發展到近100人。

在收購之後,喬布斯仍然對 Siri 保持密切的關注。該團隊的前員工表示,喬布斯每周都會出席一次會議,並就 Siri 即將發布的功能發表自己的意見。當時擔任蘋果高級副總裁的 Scott Forstall,也很支持 Siri 團隊。Forstall 對該產品能夠做什麽具有很強的洞察力,並且喜歡親力親為。一位前雇員表示,他每天都會研究技術,經常在參加團隊會議的時候告訴大家:“昨晚我又發現了10件事”。

為確保 Siri 按時發布,該團隊在 Siri 的最初構想上做了一些妥協,“人工智能應用商店”計劃不得不擱置。喬布斯希望, Siri 專注於一些只有蘋果公司才能完全控制的技術,但早期的 Siri 成員表示,喬布斯承諾會在晚些時候開始構建第三方生態系統。

2011年10月4日,Siri 發布的第二天,喬布斯因癌症的長期困擾而去世。Siri 成員表示,喬布斯的去世,基本上標誌著 Siri 初始計劃破滅。

“當 Siri 發布的第二天,喬布斯去世的時候,Siri的初始計劃就泡湯了,”前雇員回憶道, “他們因此也失去了巨集觀上的大方向”。

混亂的開始

在這以後, Siri 團隊仍然有 Forstall 的支持,但 Forstall 的注意力同時也分散在其他主要項目中,包括即將推出的蘋果地圖( Apple Maps)。 Forstall 任命蘋果地圖團隊中的副手 Richard Williamson 長官 Siri 團隊,試圖讓一切重回正軌。

幾名前員工表示,Williamson 做出的很多決策都遭到其他成員的反對,其中包括對 Siri 每年隻做一次更新。這是蘋果在 iOS 系統更新上的常用策略,而 Williamson 以前的工作就是讓軟體從後端伺服器的更新運行在手機上。 Siri 成員表示,這種模式是錯誤的, Siri 應該是一個不斷改進的在線服務,而不是每年隻更新一次。 雖然伺服器軟體在穩定性和性能方面做了很多更新,但在第一年裡, Siri 架構並沒有做任何改變。

Williamson 在一封應邀采訪的電子郵件中寫到,他認為 Siri 不持續更新這件事是“完全不符合實際”的,有關“軟體和伺服器基礎設施技術方面”的決策由他的下屬員工來決定,而他隻負責讓團隊重回正軌。

“ Siri 發布成了一場災難,” Williamson 寫道, “它運行速度很慢,並且有很多嚴重的錯誤,這完全取決於 Siri 以前的團隊,而不是我的問題。“

在聲明發表後,Kittlaus 回應到:“這個聲明簡直是滿口胡言,是蘋果歷史上最大的災難!而這一切都是蘋果地圖的負責人 Williamson 所導致的。事實上,Siri 在發布時的表現的非常出色,但是和任何一個新平台一樣,在意外大規模負載的情況下,都需要進行負載規模的調整和24小時不間斷的維護。”

Siri 首次發布時,用戶數量的激增超出預期,軟體開始崩潰。工程師忙於維持後台的正常運行,但基礎架構根本無法應對大量的數據流入。一名被任命到基礎架構的員工回憶道,最初需要 500 台伺服器處理 Siri 任務,在改進之後,才縮小到 5 台伺服器上。

“在當時,這就像一場戰爭,”另一名前員工回憶道。

上個世紀 90 年代,曾與 Siri 聯合創始人 Adam Cheyer 在 SRI 一起工作的 Luc Julia 被任命為 Siri 團隊的主管。幾位 Siri 前員工很喜歡在 Julia 長官下工作, 但是 Williamson 寫道,Julia 與蘋果公司的一些人發生衝突,其中也包括 Forstall 。 而當 Forstall 施壓促使 Julia 離開 Siri 時,Williamson 照辦了。在管理 Siri 團隊不到一年後,Julia 離職了。

Williamson 在郵件中寫道,他試圖讓團隊實施 SiriKit 項目,允許外部開發人員對 Siri 的功能進行改進,但遭到 Siri 團隊的抵製,因為 Siri 的“初始軟體非常脆弱、死板”。

Williamson 和 Siri 團隊之間的分歧,致使聯合創始人 Cheyer 於 2012 年 6 月離職,他也是 Siri 團隊最忠實的支持者之一。在另一位聯合創始人 Kittlaus 離職一年後, Cheyer 很快也離職了,這又導致了 Siri 團隊的其他幾名創始成員離開了該項目。

也在當年年底,蘋果地圖 iOS 6 系統中發生災難性的錯誤時, 蘋果解雇了Forstall 和Williamson。 Siri 前員工說,失去了這位始終支持他們工作的 Forstall ,他們感到很遺憾。

轉向搜索

在蘋果收購 Siri 不久,喬布斯發表了他的獨特見解。

2010年6月,喬布斯在《華爾街日報》的 All Things Digital 技術大會上表示:“ Siri 無意涉足搜索領域,他們屬於人工智能領域......我們並沒有進軍搜索領域的計劃,這並不是我們感興趣的領域,其他人在這個領域做得更好。“

但是,高品質的搜索設備仍然是數字語音助理的關鍵。當用戶提出問題時,人工智能需要接入知識庫並快速做出正確響應。

喬布斯的這一觀點表達了 Siri 團隊中許多創始成員的想法: Siri 將比搜索更強大。一位 Siri 成員表示,他們對 Siri 最理想的設定與 2013 年 Spike Jonze 電影中的“她”類似,電影中 Joaquin Phoenix 飾演一個孤獨的男人,愛上了他所熟悉的作業系統 “Samantha”。

持有同樣觀點的員工表示, 像 Stasior 這樣的搜索專家被任命長官 Siri 時,他們立刻表示懷疑。 Stasior 擁有博士學位,並獲得麻省理工學院電腦科學學位,自 2006 年至 2012 年擔任亞馬遜的總裁兼首席執行官,並協助創建了亞馬遜搜索部門—— A9.com。

Siri 團隊成員認為 Stasior 沒有語音或自然語言處理方面的背景,並不能成功的長官這個團隊。

“我意識到,儘管他對 Siri 特別感興趣,但他的最終目標還是要建立一個搜索引擎,” Stasior 底下的一個雇員說道, “ Siri 僅僅是一個跳板。”

當 Stasior 初入蘋果公司時,其搜索引擎功能分散在整個公司的各個應用中,並且有大量重複點。當時的在職人員說, Stasior 的主要工作就是將 Siri 和蘋果現有的搜索功能整合,來改善 Siri 的核心性能,他還努力加強蘋果公司在搜索技術領域的影響力,包括網絡搜索、媒體搜索和維基百科的數據分類。

搜索團隊員工表示,“ Stasior 的工作就是將搜索作為一項核心資產,並使其成為蘋果公司的頂級產品,” 。

Stasior 努力促成了蘋果公司一系列的收購,以支持蘋果公司內部的搜索人才和技術的發展。根據 TechCrunch 的報告,2013 年 10 月,該團隊以超過 4000 萬美元的價格收購了 Cue ,該公司建立了一個個人助理應用程式,通過用戶的電子郵件即可制定個人日程表。

2013年, Stasior 以超過2億美元的價格收購了 Topsy 。 Topsy 技術被用在 Spotlight 中,它是MacOS 和 iOS 作業系統內置的 Apple 搜索功能,並於2004年首次推出。

“ Bill 一旦發現了一些好東西,他就一定會去掌控,”一位負責收購調查工作的蘋果員工說, “他的目標就是盡可能多的獲得和鞏固更多優秀的搜索人才。”

一位前員工表示,Topsy 團隊最終成長為 Stasior 手下一個龐大的組織,其員工數量現在幾乎可以和 Siri 團隊不相上下。 Topsy 的首席執行官 Vipul Ved Prakash 將繼續長官該搜索團隊,並直接向 Stasior 做匯報。

將現有的 Siri 團隊與 Stasior 的搜索團隊組合在一起,結果證明這是錯誤的決策。 Topsy 團隊並不願意和 Siri 團隊合作,他們認為 Siri 團隊研究進展緩慢,雖然最初的基礎設施已經修補完畢,但自發布以來並沒有完全更換。

“我有一種想法就是:為什麽我們不重新開始建立我們需要建立的東西?然後再擔心二者之間的協調?”搜索小組的前成員提到, “但他們仍然著眼於二者之間的協調工作。”

這位前員工說, Siri 和 Spotlight 的核心技術是由 Topsy 技術和 Siri 數據服務二者組合而成,該服務基於 iTunes 舊的搜索技術,針對 Siri 做了改進,並於 2013 年推出。 Siri 的數據服務處理諸如維基百科、股票和電影放映時間等事項,而 Topsy 則對 Twitter 、新聞和網絡搜索結果進行排序。 Prakash 計劃將所有的技術集成到一個堆棧中,最終將 Siri 數據服務團隊納入 Topsy 團隊中。 但是由於二者基於不同的編程語言,因此很難去協調。

整合搜索團隊的困難導致了一些令人尷尬的後果:用戶使用 Siri 或 Spotlight 會得到了兩種完全不同的答案,而這些答案則是由兩種不同的搜索技術支持而分別構建的。

地盤爭奪戰

Siri 的初始技術是利用自然語言處理來理解用戶的意圖。語音處理是一款可以檢測用戶語言的軟體,最開始,蘋果將該技術外包給了波士頓的 Nuance。後來在 Stasior 的長官下,蘋果開始專注於創建自己的語音識別軟體。

2013年,蘋果還聘請了經驗豐富的微軟語音識別專家 Alex Acero ,長官一個新的語音識別團隊 。同年,蘋果還收購了語音創業公司——諾瓦瑞斯技術公司,用來積累語音技術方面的專業知識。 蘋果公司計劃將新的語音識別技術與 Acero 的 Siri 核心技術相結合,希望以此來改善 Siri 的會話性能。 Siri 團隊認為,這種技術上的結合很重要,並很可能極大的促進 Siri 的發展。

在合作了6個月以後,這個團隊於2014年年底解散了。 Acero 繼續長官語音識別團隊,而自然語言團隊則由 Anoop Sinha 長官(曾在全球谘詢公司麥肯錫公司工作的管理顧問)。

接受The Information采訪的前員工表示,在這之前,高層從未對此解散做出任何解釋,倘若真的發生了這種事, Sinha 也會有他自己的管理方式。

由於 Sinha 沒有自然語言處理領域的專業背景, Siri 團隊的幾名成員都對他很反感。 他們認為,Sinha 的決策似乎源於辦公室政治,而不是科學研究。

一位前員工回憶了其中一次會議,當時Sinha 和 Acero 公開對峙,雙方層在項目分配上爭執不休,壓迫 Stasior 做出最後的決策。這兩個派別間的緊張局勢促使了另一批員工的離職,其中包括經驗豐富的語音科學家 Gokhan Tur 、 Chuck Wooters 、 Tom Kolla r和 Larry Gillick。

LinkedIn 上 Sinha 的個人資料顯示,他已於2016年從蘋果離職,現任 Facebook 的工程經理,並且沒有對評論做出任何回應。

許多離職多年的 Siri 員工與 Kittlaus 和 Cheyer 聯手,組建了一家新公司——Viv Labs,並繼續致力於構建更好的數字語音助理。 Stasior 對此感到很憤怒,“他們值得相信嗎?”一位前員工回憶道。

在得知 Kittlaus 和 Cheyer 繼續來觀看蘋果與他們的前 Siri 團隊的籃球賽之後,Stasior 就開始擔心他們會挖人。據當時在場的 Siri 員工回憶,不久之後,這兩人便被禁止進入蘋果的園區。

強大對手的崛起

為了讓 Siri 更強大, Stasior 又繼續進行了大手筆的收購。 2015 年 10 月,他主導收購了 VocalIQ——一家致力於研究動態學習系統的英國人工智能初創公司。

一名 VocalIQ 團隊的前雇員談到,他們認為 Siri 其實是一個“手動作業系統”,並相信 VocalIQ 技術對於 Siri 的發展很有幫助。 VocalIQ 的技術可以從語音互動中提取重要資訊並對其進行分析,不斷的調整系統的準確性。 據相關人士透露,蘋果已成功的將 VocalIQ 技術整合到 Siri 日歷功能中。

此外,在前雇員 Rushin Shah 的長官下,更多的自動化機器學習技術被整合到了 Siri 的域選擇中 , 例如判斷請求需要發送還是共享 。 LinkedIn 上 Rushin Shah 的個人資料顯示,Shah 已於 2017 年從蘋果公司離職,目前在 Facebook 自然語言理解團隊中但任高級經理。

與此同時,蘋果將其在語音助手領域積攢了三年的優勢拱手讓給了亞馬遜和谷歌。 2017 年 6 月,《華爾街日報》在一篇報導裡寫道, HomePod “在家庭音箱市場上充其量也只能位居第三名”。

兩位 Siri 團隊員工告訴 The Information,為了應對這場競爭,直到 2015 年, 或者說是 2014 年底亞馬遜的 Echo 橫空出世時, Siri 團隊才知道蘋果的 HomePod 項目。據知情人士透露,蘋果公司原計劃就是要推出一款普通音箱,並不會搭載 Siri。

蘋果突然決定將 Siri 納入音頻項目,使得 Siri 語音識別團隊不得不疲於應對與 Beats 公司的每周例會。早在前年,蘋果公司就以 30 億美元收購了 Beats。Siri 前員工 Chuck Wooters 提到,在早期的會議中,大約有 25 人參與,其中也包括通過通過影片與會的幾名 Beats 員工。

Beats 團隊致力於研究麥克風降噪和波束形成算法,以便更好地接收用戶的語音命令。在灣區周圍的公寓裡,蘋果公司安裝了麥克風用來收集數據,並模擬家庭環境,他們將這些數據稱為“室內脈衝響應”。

然而,Siri 的失敗之處在於,它仍然沒有構建第三方開發生態系統,而這恰恰是 Siri 最初構想的關鍵要素。曾參與過多個開發者工具包項目的前員工稱,該項目擱置多年以後, 蘋果終於在 2016 年推出了 SiriKit 。 然而據多名相關人士消息,從 2012 年以來,蘋果就一直致力於構建開發工具包。

蘋果最終任命 Siri 團隊初創隊員 Vineet Khosla 負責管理 SiriKit 項目,通過外來開發者將他們開發的應用程式與 Siri 連接起來。 蘋果這樣做的意圖似乎是為了提升 Siri 的功能,使其不再依賴於一些有限的本地應用,比如打電話或者發資訊。

但 SiriKit 尚未兌現其承諾。到目前為止,只有 10 項功能與其相關,例如付款、預訂遊樂設施、設定待辦事項和查看照片等。一些 SiriKit 的高級工程師要麽已經離職,要麽已經離開這個項目。據知情人士透露,雖然 Khosla 仍然任職於蘋果,但已經不再長官 SiriKit 團隊,該團隊目前由 Siri 現任負責人 Robby Walker 長官。

一些 Siri 團隊的前員工指出,雖然蘋果曾經嘗試轉型成一家服務型公司,但其核心仍然是產品設計。在公司內部,創建完美的在線服務這一理念,遠不及設計具有變革性產品的意願強烈,而這也可能會像 Stasior 管理的項目那樣出現很多棘手的問題。

一前雇員表示:“蘋果公司的內部結構與員工的努力背道而馳,Bill 所要竭盡全力解決的一點就是和這種思想抗爭。”

蘋果和Siri的七年之癢:Siri的落寞之路

作者: Aaron Tilley,Kevin McLaughlin

原文鏈接: https://www.theinformation.com/articles/the-seven-year-itch-how-apples-marriage-to-siri-turned-sour

招聘

新一年,AI科技大本營的目標更加明確,有更多的想法需要落地,不過目前對於營長來說是“現實跟不上靈魂的腳步”,因為 缺人 ~~

所以,AI科技大本營要壯大隊伍了, 現招聘AI記者和資深編譯,有意者請將簡歷投至: [email protected] ,期待你的加入!

如果你暫時不能加入營長的隊伍,也歡迎與營長分享你的精彩文章,投稿郵箱: [email protected]

AI科技大本營讀者群(電腦視覺、機器學習、深度學習、NLP、Python、AI硬體、AI+金融、AI+PM方向)正在招募中,關注AI科技大本營微信公眾號,後台回復: 讀者群 ,聯繫營長, 添加營長請備注姓名,研究方向。

本文來自AI科技大本營,創業家系授權發布,略經編輯修改,版權歸作者所有,內容僅代表作者獨立觀點。[ 下載創業家APP,讀懂中國最賺錢的7000種生意 ]

獲得更多的PTT最新消息
按讚加入粉絲團