每日最新頭條.有趣資訊

機器學習泰鬥:或許該對 AI 教學進行一些思考

雷鋒網 AI 科技評論按:11 月 15 日,「全球 AI+智適應教育峰會」在北京嘉裡中心大酒店盛大開幕,峰會由雷鋒網聯合乂學教育松鼠 AI,以及 IEEE(美國電氣電子工程師學會)教育工程和自適應教育標準工作組共同舉辦,匯聚國內外頂尖陣容。

AI 智適應學習是目前產學研三界關注度最高的話題之一。此次峰會邀請到美國三院院士、機器學習泰鬥 Michael Jordan,全球公認機器學習之父 Tom Mitchell,斯坦福國際研究院(SRI)副總裁 Robert Pearlstein、美國大學入學考試機構 ACT 學習方案組高級研究科學家 Michael Yudelson 等頂尖學者。

在大會上午主論壇上,Michael Jordan 帶來了一場精彩的主題演講《以人類為中心的人工智能原理:計算、統計學和經濟學》。以下為他的演講內容,雷鋒網 AI 科技評論整理。

Michael Jordan:大家好,非常高興可以來到這裡,我對教育話題非常感興趣。我既是一名研究人員,同時也是一名教育者,我整個職業生涯都是作為教授來工作,同時我也是一名學習者,非常高興有這樣的機會,跟大家一起學習。

AI 與學習

我們現在會使用很多數據以及學習方法,讓學習更加簡單,這是一個非常好的時代。今天我會談談 AI 與學習的互相補充,我們談到 AI 促進學習,那什麽是 AI?我們可以教育 AI 嗎?AI 現在可能還不是很清楚的概念,現在仍在不斷變化,在接下來的幾十年間也會有很多變化,那麽我們應該怎樣教育,怎樣在 AI 快速發展的時代進行更好的教育?

說到 AI,我認為我們並不是要複製人的智能或智慧,而是要建立一個新的智能系統。

機器學習融合了統計學和算法,數據科學也引入了數據庫和分布式系統,而且數據科學比機器學習更易受到研究者青睞。可以給大家舉一個經濟學的概念,我們會把所有的東西聯繫在一起。

談一下新興的技術以及其他學科,其中包括決策、數據、人類的推理。數據會處於中心,其中會包括各種不同的學科,比如土木工程、化學工程。

「機器學習」、「數據科學」、「人工智能」都是一些概念,涉及到電腦系統,以數據為基礎。不同階段會有不同的研究人員,會有不同的使用方法,但是關鍵要有數據的分析。

如何演化電腦科學?首先我們需要有數據,怎麽樣能把數據進行擴展和分析,我們現在討論 AI 的時候,經常忽略的是經濟方面的因素。把不同的元素、機構聯繫起來,這樣才能通過互動有更好的結果。

現在在 AI 的世界裡還沒有討論到很多這方面的內容,可能更多的是要模仿人類,在經濟方面會有所忽略。

AI 已經被用在很多方面了,現在比較傳統的 AI 的概念就是模仿人類。超人式的 AI 現在並沒有出現,我們還有很長的一段路要走。過去 40 年間真正發生的是智能增強,包括數據處理、數據分析,還有推薦系統。

我認為我們是想要建設人工智能系統的,而且這樣的人工智能並不是要取代人類,而是讓我們有一種新的方式變得更加智慧。

過去幾十年間,包括現在,智能基礎設施一直在發展,包括數據的流動,我們會和設備進行互動。我們有這樣一個希望,想要被設備所理解,同時也想要理解他人。現在我們需要有這樣的理解,同時也會做出一些妥協。

我想說一下我們現在面臨的挑戰,事實上這更多的是關於決策方面的內容,決策的不確定性。這裡有神經科學、神經系統,我們會使用 AI 這樣一個標簽,但事實上還不夠,所以需要做出好的決策。

怎麽樣做出決策?這會有很多不確定性,另外我們還會考慮多重決策。人類可以一個接著一個做出不同的決策,機器可以在同時做出很多決策,比如說滴滴、Uber,每小時隨時隨地都可以做出很多決策,讓不同的司機去接不同的乘客,這樣的一些決策都是相互連接的,人類並不是非常善於同時做出決策。

有兩個非常重要並且相關的問題,我們怎麽樣教育傳統的人工智能、新的智能增強和智能基礎設施。這裡融合了不同的學科。第二個問題是我們如何使用這樣一些概念來教學?這兩個問題是相關的,我主要介紹第一個問題。因為我知道很多其他大會都會關注第二個問題,這樣兩個問題都能迎刃而解。

如何教育傳統的人工智能、新的智能增強和智能基礎設施

首先我想跟大家說一下我在伯克利的工作,我們有一個「數據 8」的課程,將計算思維和推理思維連接在一起。我的同事教這個課的第一版,那是三年前。現在我也在教授這樣一門課程,這門課程是關於數據科學的基礎,它將電腦科學和統計學聯繫起來,就像機器學習一樣,但是比機器學習要更廣泛。

我們是教大一新生,他們剛入學的時候就會上這樣的課程,當時不會有數學教學,但是會基於電腦來進行算法和編程方面的教學。我們在加州伯克利分校每個學期都會教超過一千名學生,接下來還會有很快速的增長,現在這個課程大家可以免費在網上下載。

我們第一期的課程非常受歡迎,男生女生都有,也有來自不同背景的學生。現在在數據科學這個領域中,我們希望有一些人才,能夠既做數據又做計算。之前的科學家他們都會說,大家應該學習一些電腦技術,我覺得這個觀點有點狹隘,大家學的應該不僅僅是編程,應該學習一些基本的電腦能力和統計學能力。我們會使用抽樣和再抽樣這些來自統計學的觀點,把它們引入到電腦當中。

我是一個統計學家,我個人對這個觀點比較感興趣,我們要發現數據背後其實隱藏著很多東西。我們首先要知道數據來自於哪裡,我們要檢索數據背後的真實世界中的源頭,這是我在電腦科學世界中學到的東西。

我們應該怎麽去做呢?不僅僅要教編程、統計學,有時候要把兩者結合起來,計算思維和推理思維是強大的夥伴。

給大家舉幾個例子,在電腦科學行業當中我們往往會做 A/B 測試,有些電腦專業學生不會做這樣的測試,因為它有關統計學。A/B 測試是什麽呢?它對比了兩種情況。比如說有兩列,每列是 1 萬名學生,有對照組和實驗組,另外還有對之前網頁的訪問量和之後網頁的訪問量進行對照。在這個過程當中有非常多的問題。

我們要給網頁做一些改變,再針對實驗組做一些處理,這就涉及到現代的統計學。

這個方法到底是什麽呢?在這張 PPT 裡有詳細解釋。

當然有些人會覺得這個測試比較無聊,但是在這個過程中你可以教大家一些知識,這樣學生會更有興趣。在這個過程中他們會學到數學,而且在這個過程中會獲得很多真實的數據,這些數據讓人覺得非常興奮。

我再給大家舉幾個例子,我們做了很多項目,當然我個人並不覺得這是非常標準的電腦課程,它們在美國卻非常流行。大家知道我們對待數據要非常小心,尤其是涉及到隱私問題。有時候我們要給數據進行加密,比如說我們要管理數據隱私和數據使用之間的權衡,會有隱私差分量化的方式,這是一種比較新的技術。

我們首先要進行數據的處理,而不是立刻挖掘數據背後到底是什麽。比如說銀行數據中包括人的名字以及他們居住的地方,在醫療數據方面我們也有相關數據庫,包括人的年齡、壽命以及他們在什麽時候獲得什麽樣的治療,我們想對這個病人的數據進行隱私化。

我們可以在人口當中做一個查詢,查詢之後我們就能獲得數據,這往往是統計學家做的事情。我們要確保既能用數據做相關業務,又能確保數據的隱私化,這是統計學和計算方面的課程,使用數據的同時能確保數據的隱私性。

我們在教授這些想法的時候,會把這些想法用課程傳遞出去,我們發現在不同的項目中會有一些相似點。在美國會有陪審團,他們往往會從居民中隨機抽樣,我們可以看到陪審團中不同民族或者男女的比例是不是和總人數的比例一樣,這跟 A/B 測試是一樣的,學生們會覺得這樣的測試非常有趣,因為他們可以用 A/B 測試的方式進行陪審團的選取,這也會影響到策略制定。還有歌詞的分類,到底一個音樂是嘻哈音樂還是鄉村音樂,這也跟 A/B 測試有關。

除了核心課程之外還會一些「連接者」課程,這是在某一特定領域的數據科學,比如社會學或基因遺傳學等等。一些「連接者」課程的例子包括《智能城市的數據科學》、《數據科學和思維》、《地理數據探索》、《歷史如何計算》等。

我們要教授一些核心想法,也要進行跨學科合作。數據科學會觸及到很多不同學科,尤其會關注到人工智能。

將 AI 與經濟學相結合

人工智能到底是什麽?電腦還沒那麽聰明,他們只是利用數據模仿人的智能。我們要把電腦變得更加智能,要讓電腦去模擬人的大腦,這也是 AI 當前做的一些事情,但是我覺得這並不是 AI 的主要目標。此外還有其他人工智能系統。

人工智能的概念到底是什麽?人類的智能肯定是智能中的一種。比如說在北京有很多飯店,每天會進很多食物,一年 365 天。在採購食物的過程中就有很多決策要做,比如說採購什麽樣的蔬菜、肉類等等,需要有很多智能投入才能做出這樣的決策。想要模擬人的智能目前還非常難,但是我們可以模擬經濟系統,其實經濟系統也是非常智能化的,這樣就能把經濟的理論應用在電腦中。

現在電腦獲得了很多數據,能夠創造一個新的市場,但大多數情況下是要給人提供服務的,這樣能夠有更好的廣告行銷,去賺更多的錢。未來的搜索引擎會創造出一個新的市場,這樣人們會有更大的意願參與,獲得更大的價值。

我給大家舉一個例子,人類的創意事實上還沒有進入到市場。現在已經有越來越多的人正在創作音樂並把它們放到諸如 SoundCloud 的網站上,現在也有越來越多的人在聽音樂,真正的市場規則應該是做音樂的人和聽音樂的人之間存在一些經濟聯繫,但是現在沒有這樣的聯繫,這樣的連接應該能創造一些價值。

我們該怎麽做呢?我們可以建立一個市場。首先對於做音樂的人來說,我們可以做一個 dashboard 讓其知道他們的聽眾在哪,有了這些數據之後,可以使用這個數據,讓音樂家在有聽眾的地方演出。然後音樂家可以向他們的粉絲提供報價,例如在粉絲的婚禮上唱歌。這樣一來生產者和消費者就聯繫起來了,就會產生更多的收益。但我們現在並沒有把生產者和消費者聯繫起來。

我相信不光在音樂方面,在很多其他方面,例如個人服務、資訊服務方面都是如此。

最後幾分鐘跟大家說一下多決策過程,在這樣的過程中沒有經濟的參與,只是在不同的人中做了不同的決策。有這樣一個經典推薦的過程,比如說亞馬遜或阿里巴巴向大家推薦電影,現在給兩個人或者兩千個人推薦了同一部電影,大家覺得有問題嗎?沒問題。如果我把同一本書推薦給兩萬人甚至二十萬人,我認為這本書是好書,有問題嗎?可能也沒有問題。

但是在吃飯時呢?要是系統給我推薦了我想吃的菜,而不是把同樣的餐廳推薦給 100 個人甚至 1000 個人,它就是個性化的過程。在機場外部,如果給所有司機推薦一條路,如果大家都走這條路,就會產生交通擁堵。推薦同一支股票給大家,也會引發股市上的一些問題。

這樣的一些原則在經濟學上是可以適用的,過去幾十年我一直在學習這些原則的應用。

我希望大家覺得我這樣的報告非常有意思,我現在也要進行小結:如何將 AI 和教育聯繫起來?現在 AI 確實在改變所有的事情,改變數據,改變我們的生活方式,但是我們不應該僅僅用傳統的方法,我們可以有一種全新的方法,全新的 AI,我覺得這是我們應該去想的問題,謝謝大家。

獲得更多的PTT最新消息
按讚加入粉絲團