每日最新頭條.有趣資訊

從研發到產品 微軟是如何打造AI的?

騰訊科技訊 據外媒報導,光有傑出的研究人員和一大堆受歡迎的產品是不夠的。你必須擁有一個或多個系統,以便將科技融合到產品和服務中,從而為企業和消費者帶來不同的體驗。微軟就是這樣來打造AI的。

為了探尋微軟對人工智能感興趣的根源,你需要追溯到亞馬遜、Facebook和谷歌出現之前的時代。

比爾-蓋茨(Bill Gates)於1991年創立了微軟的研究部門(MSR),而人工智能從一開始就是一個研究領域。

三年後,當時的銷售主管史蒂夫-鮑爾默(Steve Ballmer)在西雅圖舉行的全美人工智能大會上發表演講,強調了微軟對人工智能發展潛力的信念,並表示他希望有一天軟體能足夠聰明,能夠駕駛一輛汽車。(他一到會場外的停車場就撞壞了自己的車。)。

從一開始,微軟研究部門就雇傭了很多電腦領域最有遠見、最有成就的科學家。在很長一段時間裡,它一直努力將自己的創新成果轉化為客戶想要的功能和產品,並因此而聞名。

例如,在20世紀90年代,筆者還記得當時感到非常困惑:為什麽微軟在語音識別等領域的雄心勃勃的計劃沒有對其Windows和Office產生深遠的影響?

在薩提亞-納德拉(Satya Nadella)擔任微軟首席執行官五年後,這種冤罪殺機已不複存在。納德拉的個人決心肯定起到了作用。

微軟的人工智能和研究執行副總裁哈裡-舒姆(Harry Shum)說:“納德拉迫切需要將更多的技術應用到我們的產品中。這對我們微軟研究部門的每一個人來說都是非常鼓舞人心的。”

這也是屬於很多人的快樂:效力於MSR部門的1000多名電腦科學家,包括在微軟雷德蒙德總部以及波士頓、蒙特利爾、北京、班加羅爾和其他地方的辦事處工作的員工。

首席執行官的決心本身只能做到這一點。微軟擅長於確定在哪些產品中使用哪些研究成果,鼓勵分散在各地的員工在這方面進行合作。

必須指出的是,舒姆認為以前的微軟未能利用其研究人員的突破性研究成果,這是不公平的。但他並不否認微軟在他所說的“以產品部署驅動研究”方面比過去要好得多。“現在的關鍵是我們能以多快的速度實現這些事情。”他說。

從筆者最近參觀微軟園區的情況來看,微軟正在以一種不斷加速的速度來轉化研究成果。筆者和舒姆及其同事們談到了該公司迅速而廣泛地擁抱人工智能的過程。結果筆者發現,這不是一個過程,而是一堆過程。

思想交流會議

在最基本的層面上,確保微軟AI不斷創新,從而讓微軟客戶受益,這確保了研究團隊和產品團隊不會各自為戰。這意味著鼓勵團隊相互交流。微軟現在正以一種大的、有組織的方式進行交流。例如,每六個月左右,就會有一個叫做ROC的活動專門用於研究團隊和Office產品開發團隊之間進行互動交流。

“我們會有為期兩三天的研討會,讓微軟研究部門的50人和Office部門的100人聚在一起進行交流。”舒姆說。每個人都分享他們正在進行的工作,整個事件以一次黑客馬拉松活動結束。

另一個正在進行的思想交流會議——傑出工程長官講座系列——把負責產品的管理人員請到微軟研究部門所在的99號大樓。

“我說,‘你們需要進來幫我做三件事。’”舒姆說,“首先,告訴我你們的產品路線圖。第二個問題是列出你們需要微軟研究部門幫你解決的10件事。第三點是,在你們離開大樓之前,要確定一兩個我們將共同努力的項目。”

當然,讓人們談論問題和解決方案只是開始。AI改進Office日常任務(如格式化文檔或將數據插入電子表格)的潛力是巨大的。

但我們也不難發現,自動化技術的幫助讓人感覺被冒犯,而不是感覺有幫助。例如,Office 97的Clippy智能助理,它仍然是令人討厭的、不受歡迎的科技代言人。

在Office根除Clippy十多年後,它仍然試圖檢測你是否正在執行可能用得上AI的任務。它只是希望這種體驗是微妙的,而不是冒犯性的。正如Office的首席產品規劃經理羅納特-勞倫斯(Ronette Lawrence)所說的,“我們的核心原則之一就是確保人類永遠是英雄。”

勞倫斯說,微軟最近為Office添加的幾乎所有東西都有人工智能和機器學習的元素。例如,在PowerPoint中,該公司希望AI成為“在雲端為你工作的設計師”。如果你使用的配有手寫筆的電腦,例如微軟自己的Surface,PowerPoint可以將你手寫的文字和畫的圖形轉換為拋光的文本塊和對象。如果軟體注意到你正在輸入一系列的日期,它就會意識到把它們安排成時間軸的樣子。

然而,勞倫斯說:“我們會小心地確保這些建議是小聲的建議,而不是強行向你灌輸你並不想要的建議。”

Design Ideas功能會分析你的演示文稿,並在幻燈片右側顯示調整的縮略圖(例如,一系列日期進行時間軸排列)。這樣做既便於你借鑒它,也容易讓你忽略它。

儘管許多Office功能依賴於微軟研究部門的最新工作,但有些研究項目比其他項目更容易走出實驗室。

“有些感覺就像科幻小說一樣虛無縹緲。”勞倫斯談到人工智能的形式時說,“有些則感覺更已可以轉換為產品。”

在Office產品團隊和微軟研究團隊召開的一次專題研討會上,人們通常回先在Word文檔中擬出梗概,然後再填上詳細內容——或者讓同事來填充內容。如果Word也想來做這件事呢?

一個新的待辦事項功能旨在通過掃描文檔中的佔位符(如“TODO:獲取最新的營收數據”或“在此處插入圖表”),並在側欄中列出這些佔位符,以便讓你記住要處理它們。微軟計劃擴展該功能,以便讓你的同事通過回復電子郵件來提供你需要的資訊,而不是在你的文檔中翻找待辦事項。它還打算利用人工智能提供相關內容。

首批獲得這個初級版待辦事項功能的Office用戶是Windows和Mac用戶,他們已經注冊了Office早期使用者計劃。(它將在今年年底前正式發布。)

然而,在通常情況下,新的AI功能首先出現在Office基於網絡的應用程式中,比起傳統等待Office發布下一版本,微軟現在更容易迅速面向許多人推出更新版本——並進行學習和優化。

勞倫斯說:“對我們來說,傾聽反饋資訊,看看人們如何使用它,這對我們訓練模型很重要、這屬於微軟新時代的新做法。當你發布新功能的時候,重要的不僅僅是關於功能的可用性。網絡為我們提供了反饋機制。”

當前的一系列在線廣告致力於表明Office 365服務具有一系列便捷的功能,這些功能在Office 2019(該套件的一次性付費版本)中並不具備。所有這些功能都利用了人工智能,但廣告沒有提到這一點。畢竟,人類應該是英雄。

改變遊戲

人工智能是什麽時候開始對影片遊戲業務產生影響的?如果你問微軟Xcloud RD的合夥人兼總經理凱文-加米爾(Kevin Gammill),他會追溯到四十年前,提出早期的電腦控制的競爭對手,比如Atari公司的Asteroids街機遊戲中的飛碟。他說:“我認為,只要遊戲存在,人工智能就已經存在了。”

2019年,人工智能在遊戲中的潛在應用遠遠超出了幫助壞人作弊的範疇。微軟是一家罕見的公司,在遊戲和電腦基礎研究方面都投入了大筆資金,它有很好的條件來探索這些問題。

這包括有用的東西,可以使遊戲玩家的生活變得更好,而不是讓他們尖叫“嘿,人工智能!”例如,研究表明,當兩個玩家水準差不多的時候,在線競爭最有益。

加米爾解釋說:“如果你進入一場比賽,你只是被屠殺,這可能不是一個好的經驗。如果每個人都太過輕鬆,這可能也不是一個好的體驗。”

Xbox Live長期以來一直使用一種名為TrueSkill(最近已更新為TrueSkill 2)的算法來幫助確保玩家既不會感到無聊,也不會被對手屠殺。

管理Game Pass服務的阿什莉-麥克斯西克(Ashley McKissick)說,另一項實用人工智能的靈感來自於這樣一個事實:“多年來,微軟從遊戲玩家那裡響亮而明確地聽到,他們更願意花更多的時間玩遊戲,而不是下載遊戲。”

該公司試圖讓玩家借助於某種系統在遊戲下載完成之前可以開始玩遊戲。因為該系統需要遊戲發行商進行一些繁重的工作,因此並未得到普遍採用。

從去年夏天開始,微軟用一項名為快速啟動(FastStart)的AI技術取代了人們感到不滿的手工勞動。它利用機器學習來確定首先下載遊戲的哪些部分,讓遊戲玩家開始玩的速度達到原來的兩倍。

麥克斯西克說:“我們並沒有真正改變這裡的物理定律,但它確實讓你的下載活動變得更靈活。”

微軟正越來越多地將那種幫助在遊戲中整合AI的協作方式正規化。與名為Roc的MSR/Office會議類似,名為Magneto的會議旨在促進MSR和遊戲公司之間的對話。微軟XCloud COGS的合作軟體工程師經理塔米爾-梅拉米德(Tamir Melamed)表示,除了這兩個與會者,“那裡還有必應(Bing)的人,那裡有Windows的人,還有Azure雲服務的人。因為我們認為我們有很多技術可以進行分享。”

在微軟公司一年一度的黑客馬拉松活動中,出現了一個聯合項目。2017年,這家遊戲行業正在努力應對管理Mixer的挑戰。Mixer是一種遊戲流媒體服務——使用與Twitch相同的Zip代碼,但更具互動性——微軟旗下的Beam初創公司收購了這項服務。

Mixer的總經理查德-吉布森(Chad Gibson)表示:“我們發現自己的在線觀看量比我們預期的要多得多。因此,我們試圖回答這個問題,‘我們如何才能提供新的、獨特的方式,讓《絕地求生》(PlayerUnknown’s Battlegrounds)或《要塞英雄》(Fortnite)的優秀玩家被發現?’”

就在Mixer團隊問自己這個問題的同時,一些微軟研究部門的員工贏得了黑客馬拉松的勝利,他們設計了Watch For人工智能系統,用於分析實時影片流,並識別其中的特定事件。(微軟對這項技術的商業潛力感到印象深刻,以至於它宣布了團隊的勝利,但沒有透露它到底創造了什麽。)

這兩家公司合作使用Watch for作為HypeZone的基礎,HypeZone是Mixer的一項功能,可以讓觀眾直接觀看正在在線播放的遊戲中最高潮的部分。

吉布森說:“這讓我們可以進行我們原以為不可能的新發現。”

只要遊戲存在挫敗感,AI就應該提供新的方法來減輕它。最近,加米爾在第一人稱射擊遊戲《虹彩六號:圍攻》(Rainbow Six Siege)中與三個朋友進行了激烈的競賽。然後,其中一位選手的網絡連接被卡住了。

“我們三個人跑來跑去,一個僵死的角色站在那裡。”他說。一個僵化的角色除了被砍倒之外什麽都做不了。

更好的情景是遊戲可以使用AI來確定一個玩家已經被斷網,然後臨時控制相應的角色——並以與那個人相同的方式玩遊戲。加米爾說:“現在,我們已經非常接近於這樣的場景了,這些場景實際上已經實現了。”

擁抱AI需要從芯片開始

史蒂夫-賈伯斯(Steve Jobs)喜歡說,蘋果是唯一家打造“整個小部件”的電腦公司——包括軟體或硬體,而且兩者都集成得很好,以至於形成了無縫銜接的體驗。近年來,這一理念已經達到了極致。蘋果甚至設計了自己的iPhone和iPad處理器,並為運行蘋果軟體對它們進行了優化。

對智能手機或平板電腦有意義的縱向集成,實際上對數據中心也是有意義的——比如為微軟Azure雲服務提供支持的那些數據中心。微軟設計了一種定製硬體加速器Brainwave——使用了英特爾的現場可編程門陣列(FPGA)——主要是為了加速在Azure雲服務中運行的AI。

微軟為優化AI而設計自己的硬體的舉動並不是唯一的。出於類似的原因,谷歌(Google)和亞馬遜(Amazon)也都在從軟體領域向芯片領域拓展。

但微軟並不僅僅是加入了一股時髦的潮流。Brainwave計劃是道格-伯格(Doug Burger)十年前的思考的最終產物——起初,他自己完成了這項工作。“我在2010年開始這項工作,然後在大約一年後向管理層匯報。”伯格回憶說。他當時是MSR部門的一名研究員。

傳統的芯片知道如何執行其程式中的計算指令,並且永遠不能為其他目的再接受培訓——例如高效地運行新的機器學習算法。相反,伯格說,FPGA就像變色龍。他解釋說:“FPGA允許我們快速打造產品,並將其投入生產,然後以非常快的速度進行更新。所以說,這種變色龍的顏色變化真的很快,而且每次改變顏色都會變得更好。”

FPGA技術使微軟能夠提供高效的深度學習服務,以滿足客戶的特定需求。“他們想要解決的很多問題都與影像分析有關。”Azure機器學習算法的高級項目經理泰德-韋(Ted Way)說。

“‘我想看看我的製造缺陷。’‘我想看看(產品)是否缺貨。’‘我想看看有沒有人在我的加油站抽煙,因為我怕火。’道格的團隊能夠扭轉這一局面,並在短短六個月左右的時間內構建出這些在FPGA上超快運行的卷積神經網絡。”

按照矽芯片的標準,這樣的速度是很快的。

當伯格在2010年開始他對FPGA進行個人研究時,人們還不清楚——至少對那些不是有先見之明的電腦科學家來說——AI能以多快的速度成為主流,更不用說把它打造成一項服務。

對微軟這樣的公司來說,這將是一項戰略要務。很快,微軟明白了他的創意能給Azure帶來的價值。去年7月,Brainwave項目走出實驗室後,伯格和他的團隊也離開了實驗室。今天,他們作為Azure部門而不是MSR部門的一部分,繼續著他們的工作。

這樣的情景並不少見。伯格說:“關於微軟文化的一件事是,研究和產品之間的界限已經模糊了很多。產品小組中有許多人以前是研究人員,正在開發新的東西。研究不僅有做研究的人,也有打造產品的工程師。這更像是一個連續統一體。”

他補充說,納德拉“在推動這種創新方面做得很好。”

聊天機器人

有了Azure,微軟正在與亞馬遜和谷歌展開競爭,為各種類型的企業提供人工智能和其他高級計算功能,如按需服務。這不僅對外部公司有利,微軟內部也有一些團體可以從預先打包的人工智能和機器學習中獲益。

一個典型的例子是Codie,這是一個多語言聊天機器人,旨在提供有關編碼的資訊。這是微軟目前的一個內部實驗項目,而不是一個商業產品。

它源於這樣一個認識:對於潛在的軟體工程師來說,一個主要的障礙就是獲得有關Python編程語言中的命令和SQL數據庫查詢語法等資訊。對於以英語為母語的人來說,這個問題尤為嚴重。

馬特-費舍爾(Matt Fisher)是Office365和微軟365的高級數據分析經理,也是Codie的創建者之一。他將這個多語言聊天機器人描述為“Cortana的怪人小兄弟”。

它來自微軟的Garage項目,這是鼓勵員工研究他們感興趣的東西,並給予他們資源的項目,不管他們的這些興趣是否完全符合其工作職責。

創建這個機器人的團隊中有15名背景各異的員工,包括開發人員、設計師和行銷人員。它擊敗了767個其他項目,贏得了該公司的雷德蒙德科學博覽會獎,並在該公司的包容性挑戰中的5875個參賽者中脫穎而出,取得了第二名。

使用基於文本的輸入,Codie通過從微軟的必應搜索引擎和科技建議網站Stack Overflow中獲取資訊來回答編碼問題。在微軟商店(Microsoft Store)工作的軟體工程師阿夫琳-拉赫曼(Afreen Rahman)表示:“48小時後,我們就打造出了這個機器人,它操五種不同的語言,並可以從一個龐大的資訊數據庫中提取資訊。當你就可以用西班牙語問它一個編碼問題時,你就會得到一個用西班牙語回答的答案。”

雖然Codie的創造者為企業帶來了各種各樣的技能,但他們中沒有一個人一開始就對AI有那麽多的了解。“我們使用了現成的工具,這些工具是微軟提供的AI套件中的一部分。”拉赫曼說,“作為開發者,我們可以在短時間內拿到文檔,然後就可以開始工作了。”

費舍爾滔滔不絕地說出了微軟為Codie提供的雲服務:“我們使用了從Azure機器學習服務到LUIS語言理解等各種服務。QNA Maker、必應圖譜、微軟圖譜、Azure機器人框架、Azure 語音插件。”

那裡包含著微軟的很多人工智能專業知識。對於Codie和人們想要打造的其他東西來說,這已經足夠了。

就利用人工智能來從事鼓舞人心的目的而言,Codie已經取得了成功。建造它的人正在考慮更新——顯而易見的一個問題就是讓用戶說話而不是打字——以及如何使它獲得廣泛使用。

費舍爾說:“我們的目標是將它推廣到微軟之外。我們正在努力做相應的準備工作。我們得到了Garage這一可愛團隊的支持。但在許多情況下,這是我們的第二或第三份工作。”

真正的問題,真正的研究

微軟打通研究和產品團隊的新方法並不只是讓產品受益。AI對數據有著貪得無厭的欲望,它需要這些數據來訓練機器學習算法。

微軟,作為世界上最大的科技公司之一,擁有大量的匿名數據。這意味著,如果有一天,它的研究工作切斷了與人類的聯繫,那麽它的研究就完蛋了。

“現在,要做很多令人興奮的AI研究。你需要發現真正的問題,需要訪問大量數據。”舒姆說,“這正是你與產品團隊合作的地方。你構建新的模型,培訓新的模型,然後調整新的模型。現在你已經進一步推進了你的基礎研究。一路上,你永遠不會知道你是否會有突破性的進展。”(騰訊科技審校/樂學)

獲得更多的PTT最新消息
按讚加入粉絲團