每日最新頭條.有趣資訊

侯世達:我討厭“人工智能”這個詞,因為它們沒有智能

四十年前,一本奇書《哥德爾、埃舍爾、巴赫:集異璧之大成》橫空出世。作者道格拉斯·霍夫施塔特(中文名侯道仁,中譯第一版使用的譯名是侯世達)在這本書裡橫跨藝術、音樂、數學、意識和智力等眾多領域,成為那個時代最令人印象深刻的AI著作,為他贏得了普立茲獎和美國國家圖書獎。

然後他就消失了。

《哥德爾、埃舍爾、巴赫:集異璧之大成》 | 圖片來源:douban.com

他並沒有真的失蹤,還在一直思考AI。但是,《集異璧》出版的年代,正好是“古典”AI時代最後的光芒。三十年的研究並沒有像研究者預期的那樣給出關於智能的突破性進展,熱情和經費都在逐漸消退。人工智能研究者逐漸把重點放在能否讓機器系統來解決實際問題;至於圖靈當年提出的那個問題——“機器能思考嗎”——被大部分人認為太過哲學、太過模糊,隻適合放在課本的第一頁,而和日新月異的應用無關了。

今天,最火的AI路線是機器學習。如果一個人只看新聞頭條的話,也許會覺得AI問題已經被解決了:機器學習AI能下棋,能開車,能翻譯,能聊天,能看病,能答題,能認動植物,能寫詩作畫,就差取代人類了。

真的嗎?

侯道仁不這麽認為。他說,AI不“懂”。AI在操縱數據,但不知道這些數據是什麽意思,不知道它們還對應著一個現實世界。脫離現實的AI永遠不會懂得現實。

道格拉斯·霍夫施塔特 | Greg Ruffing

在這個問題上他顯然是少數派。他已經幾十年沒有參加過學術會議了,也和AI的主流研究者罕有對話——“我對他們的狀態不感興趣”。很多時候這算不上真的衝突,雙方只是在就不同的話題和不同的時間尺度思考。

但他所思考的問題確實是直擊盲點。

數據集裡能堆砌出智能嗎?不帶目的和情緒的,算得上智能嗎?現在的AI能做很多事情,但它們真的“懂現實世界”嗎?或者,它們只是一個個空無一物的黑盒子而已?

毫無疑問,今天的人工智能領域非常成功,不需要考慮這些問題也在快速進展。但是這樣的進展也許是沒有辦法持續下去的。不去解決一些更加深層的問題,也許就會像寓言裡那個想靠爬樹抵達月亮的人一樣:“他將不斷進步,直到樹的盡頭。”

圖片來源:圖蟲創意

Q&A | 果殼 侯道仁

果殼:為什麽你會采取這樣一種脫離主流的研究方式呢?

:我其實不覺得我是在正常意義上的“做研究”。我是以一種個人的狀態在探索想法,如果可能的話,就寫書來傳遞它們。驅動我這樣做的,是一種尋找美、尋找優雅的力量。另外我還喜歡不嚴肅

我對企業的商業目標不感興趣——你知道就像谷歌的AI產品什麽的。我感興趣的是理解人類思考,理解語言,理解這些東西的深度和複雜性

我對這些事情十分尊敬,而我的感覺是那些科技公司好像就不怎麽有尊敬的態度。這個肯定不是一概成立,做這些項目的人成百上千,每個人都是獨一無二的人,都有自己的想法;但是公司自己會有一種動量在推動這些人,讓他們去公開宣布“我們抵達了人類翻譯的水準”這樣的話。

我不知道谷歌翻譯團隊的成員是不是真的相信這些話,但是他們顯然有這種“Chutzpah”——你知道Chutzpah這個詞嗎?這是一個意第緒語的詞,有這種狂妄自大來說這樣的荒謬言論。當然他們的產品是很厲害,往谷歌翻譯裡敲一篇文章或者複製一個網頁,兩秒鐘之後右邊就出來譯文。有時候譯文會很不錯,因為他們確實用了海量的知識,不,不是知識——

圖:圖蟲創意

果殼:數據?

:對,數據,而且相當的快。但是很多時候,譯文都差得好遠。就像我舉過的例子: The roofer came down from the roof of the hospital carrying a case of shingles. (屋頂工人從醫院的屋頂上下來,帶著一箱瓦片。)

翻譯軟體給出的是“一箱帶狀皰疹”。這和帶狀皰疹沒有任何聯繫啊!屋頂工人帶著的shingles很明顯毫無疑問是瓦片。而且它還用的是“一箱”。你怎麽可能有“一箱”疾病呢?

這完全講不通,這是垃圾。但是這就是翻譯軟體做的事情,因為它根本就不理解任何東西。是零。它不知道有這樣一個世界,有這麽多事情正在其中發生,不知道有過去和未來,不知道有大有小有上有下。它什麽都不知道。它所知道的一切就只是字詞。

果殼:而不知道意義?

:甚至都談不上是知道字詞,它只是在使用字詞而已。連這麽簡單的句子都不能理解,你怎麽能宣稱這是人類級別的翻譯呢?

果殼:這些不算個別的例子嗎?

:你得用這些例子才能揭示出它後面的空洞,證明它沒有理解。機器翻譯是巧妙的花招,有時候能完美生效,在簡單句子上通常都能行——但不是每一個句子都行

整個機器翻譯領域裡最著名的一個例子,“The box was in the pen.(盒子在棚裡。)”我試過的每一個程序在這個句子上都失敗了。甚至給了上下文也沒有用:“Little John was looking for his toy box. He looked everywhere and he finally found it in the pen. He was very happy.(小約翰正在找他的玩具盒子,找遍了所有地方,終於在棚子裡找到了它。約翰很高興。)”

果殼:都翻成了盒子在筆裡。

:而任何人類都能理解。當然他們可能會笑一下覺得這個很有趣,因為pen這個詞乍一看可能會讓人覺得是你口袋裡的“筆”,顯然原句的pen說的不是筆。但是人類頂多是想一想,而程序則直接掉進了坑裡。但如今60年過去了。這個句子來自機器翻譯領域有史以來最著名的文章,發表於1959年;60年之後的現在,這麽多機器學習的成就,都還無法讓程序跳出這個陷阱

而且機器學習還很大程度上是黑盒子,如果它犯了一個錯誤,你很難知道要怎麽修。

果殼:我覺得這種事情就像是自駕車的狀態一樣,它們好像是能識別出看到的圖像,但其實並不能真的理解這些圖像。你會不會覺得,讓AI在不理解這一切的情況下做這些事情是危險的?

使用自駕系統時發生車禍的特斯拉汽車 | 圖片來源:BBC

:當然是危險的。的確,我們有很多工具做了很多事情,這些工具也啥都不懂。比如說機場的不同航站樓之間有小火車連接,車裡沒有人類工程師或者司機,但這都是很簡單的,是固定軌道,固定起點終點,軌道上幾乎不可能有什麽障礙,所以你能信任它。某些大城市的地鐵也是,不需要司機,因為軌道都是純地下的,不可能有障礙,你不理解也沒有關係。但是對於自駕車,我的感覺和翻譯軟體差不多糟糕。

現實世界裡的可能場景是無限複雜的,駕駛時出什麽狀況完全不可預料。我覺得這極其糟心。不管怎麽說吧,我是不喜歡AI(人工智能)這個詞的

果殼:如果你能重新發明一個詞的話你會怎麽說?

:我不知道。我覺得自駕車(self-driving car)是可以的,不用“智能”這個詞,智能不是這個領域討論的話題。當我們說智能的時候,其中的確有一部分是實時對看到的場景進行分類;我對自駕車懂的並不太多,我知道他們用的很多技術和人類開車不同,他們會用GPS,會用雷射雷達,如此等等,這意味著自駕車看到的場景和用到的信息與人類不一樣。

我不確定它們到底在幹什麽,但是你可以說這的確是實時感知,對快速變化的圖像進行實時分類,這是個動態而非靜態的過程,這當然是智能的一部分,但絕對不是全部的智能。所以我不喜歡把智能這樣的詞用在這樣的系統上。

二十世紀五六十年代那會兒,說“我們正在研究AI”是沒問題的,我們是在研究它,是在嘗試理解智能,但現在人們不那麽說了,人們說“這是智能的”,“那是智能的”。我不喜歡這樣。這是過度簡化扭曲,誤導原意。

果殼:開車和翻譯都是很難的現實問題,不過創造性的問題呢?阿法狗在圍棋上打敗了人類,我就感到相當震撼。

柯潔VS阿法狗 | 圖片來源:theguardian.com

:我同意,震撼(shaken)是對的詞,我感到很難受,為圍棋選手感到悲傷。不過,你知道有一個微軟的程序能夠寫詩——

果殼:是的,他們居然還真的出版了。

:我不知道你說“真的”是什麽意思,顯然這年頭人們是可以出版任何東西的!這不算什麽啦。但是我想說,隨便寫點現代詩沒什麽了不起,這很容易,寫出來的大部分是垃圾。搞一本垃圾宣稱這是詩歌這不算什麽成就。這樣的事情早就被做過了,我自己五十五年前就寫過這樣的程序。這不算啥——好吧也許五十年前可以算啥吧。

但像某些人說的那樣把這個稱為是計算機的創造力?這完全是荒謬,完全是無稽之談。擁有創造力是和情緒聯繫在一起的。強烈的智識激情、好奇心和驅動力,愉悅感和玩耍心,樂趣、神秘、發明欲望——所有這些在今天的計算機裡都找不到。什麽都沒有,零。

當然計算機是能做很多事情。二十五年前有個人曾經寫過一個程序——後來我和他成了朋友——這個程序可以發現新的歐式幾何定理。它是在探索幾何學的新東西。但是它的做法是完全機械的,它對幾何學沒有任何興趣,沒在思考,沒在享受,沒在尋找美,沒在做任何這樣的事情,只是機械蠻力瑣碎的探尋,把數字算到15位小數,檢查點是不是在線或者圓上,這些事情對人類而言是極端困難極端無聊的。

如果你作為一個人來檢視它產出的成千上萬結果,偶爾也會發現一個優雅的定理。但是機器並不知道它的優雅,對優雅不感興趣,對任何東西都不感興趣。說這個和創造力有什麽共通之處是很荒謬的,可是人們就是經常這麽說。他們說這樣的話的時候根本沒有想過到底什麽是創造力、什麽是智能。所以我是真的討厭說我們在用“人工智能”做事情。我們沒有這種東西

果殼:AI最早的時代,圖靈說因為我們不知道電腦有沒有思考,所以我們應該看它們的思考結果來判斷。現在我們有EMI(“音樂智能實驗”,一個可以模仿作曲家風格創造出新音樂的程序)這樣能產出類肖邦的音樂,阿法狗這樣打敗人類的棋手,這些算不算那種思考結果?

:不算,因為阿蘭圖靈說的是使用語言。

果殼:所以語言是人類思考的核心?

語言代表著概念,日常的詞語和句子都對應著我們心中的概念,是給概念上標簽的方式。當然不是所有的概念都有標簽,但很多都有,我們使用語言是為了外化這些概念。這才是圖靈所說的東西。當然圍棋也對應著概念,這個概念讓阿法狗能夠下圍棋,但這不是關於整個世界的,這只是一個極小極小的微縮世界。

至於EMI,我寫過很多東西,做過很多講座——

果殼:啊我讀過《如聆巴赫》。

:那個是一個縮寫版的文章,我寫了大概40頁的東西,被縮到了10頁左右。我忘了是不是我自己縮寫的,快20年前了。很不幸,它沒能完全概括我想說的東西。

我覺得EMI是個騙子。它產出的大部分東西都很明顯是從別的作曲家那裡借來的。你越是熟悉那些作曲家的作品,就越能看出來它只是拿來片段然後放在一起。這和創造音樂沒有任何關係,是零,也和人類與音樂的關係毫無相似之處。它只是一個流於表面的模仿而已,這就像是那個三字母遊戲。

你知道這個遊戲嗎?就是你找一篇文章,比如林肯的葛底斯堡演講,是什麽文章無關緊要。然後你統計一下這篇文章裡三字母組合的出現頻率,比如AAA沒有出現過,THE就出現了好幾次,或者HE空格,空格也算一個字母,這樣匯聚成一個頻率表。然後你找兩個字母,我一般是隨機的,在表格裡查下一個字母是啥。比如說開頭的字母是TH,那麽你就查一下THA、THB、THC……一直到TH逗號、TH句號和TH空格的頻率,然後根據這些頻率來隨機選擇第三個字母。最大的概率也許是THE,但你並不總是能選擇它,也許這一次你選的是THR。那麽,新的雙字母就是HR,再去表格裡查HRA、HRB、HRC……諸如此類。

果殼:這就是一個馬爾柯夫鏈了。

:對,就叫這個。你用這樣的方式創造出一篇新的文本,然後看看它長啥樣。它和原來的文本會有很大的相通之處。你也可以不用三字母,而是用四字母、五字母或者更多。甚至可以把一整本書都作為源文本,統計裡面的頻率,創作出新的人造文本。粗看起來,它在局部上會很像是原來的作者寫的東西,可能連著幾個詞都很正常,特別是當你用四字母或者五字母來生成的時候;但是它根本沒有任何含義,全局而言它是垃圾。這個點子是大概70年前被發明的,已經被充分地研究過了。當然這樣做出來的東西很好玩,本質上EMI做的也是這個

但它做這樣事情的時候並不智能,並不懂音樂。這並不是對作曲家的威脅,只是一個小玩具能讓計算機快速地把音樂小片段拚合在一起。其產物有時候聽起來還有點說服力,可是這和創造音樂沒有關係,和理解音樂沒有關係,和任何事情都沒有關係,空無一物。然而正是這種東西在被不斷吹捧成人類級別的成就。

果殼:但是有沒有可能沿著這條路線開發出一種不同於人類智能的東西呢?比如阿法狗是不是發現了一些人類沒有看到的關於圍棋的深刻見解?

:如果有,它必須是情緒化的。情緒是智能的核心,沒有它就沒有智能。當然你能看出來,我現在所說的這些都是非常情緒化的,這沒錯,我們說的一切都充滿了情緒,被情緒所驅動,智力就是這個樣子的

阿法狗確實做到了一些驚人的事情,我絲毫不懂圍棋所以沒有辦法評論,但顯然它找到了某些模式,是人類從來沒有注意過的,而且運用這些模式下了一手好棋。我不知道說它“理解”圍棋算不算用對了詞,因為理解是個很難講的概念,但至少它肯定是找到了關於圍棋的一些事實,一些強有力的不為人知的事實

我覺得這很了不起,也很讓我沮喪和擔憂,但我不覺得這是一條通向非人智慧之路。如果在很久以後的未來你能造出個電腦程序,可以和人類溝通交流想法,那是一回事,但下圍棋不是交流想法,只是玩遊戲而已。不,它甚至都不是在玩遊戲,只是在操縱符號,它不知道這是個遊戲,不知道遊戲是什麽東西。

但如果將來人們能開發出和人對話的程序——嚴肅地討論觀點和想法,不是聊天機器人那種,不是問“siri附近有什麽印度餐館”。我非常不喜歡現在這些東西,絕對不會用它們,雖然我知道有很多人喜歡這樣的小軟體。

總之如果我們將來真的有一個系統能和人對話,那麽它必須要知道關於人類生活的幾乎一切東西。需要懂得人類的情緒,自己必須擁有情緒,必須有擔心、恐懼、不安感,如此等等,就像人一樣。這是獲得智能系統的唯一途徑,而我們距離它的實現還很遠

圖:圖蟲創意

果殼:沒有捷徑嗎?也許我們可以複製人類體驗的一部分,而不用把所有可能的體驗教給機器?

:我覺得沒有,不過我不知道是怎樣的捷徑。一部分體驗,一丁點還是可能的,圍棋不也是一部分嘛。

果殼:所以機器面臨的難題是什麽呢?

:情緒是伴隨著一套內置的目標而產生的,我們談論的對象必須要追求這些目標,需要能快速判斷出它做的事情對於這些目標而言是好事還是壞事,而情緒就誕生於這種對好壞區別的感知

果殼:不過我們確實是在給遺傳算法設置目標呀,這不夠嗎?

:但這些目標和它的存活、它的福利之間沒有產生聯繫。它沒有在試圖保護自己,沒有試圖過更好的生活。情緒來自鬥爭,為了生存的鬥爭。現在並沒有這樣的東西

果殼:這聽起來是適者生存,要模仿演化的路線。

電腦可以演化嗎?當然可以,全世界成百上千萬的電腦都在不斷改變,比起50年前大不相同了,這也算是一種自然選擇。自然選擇就是世界上有不同的東西在競爭,被環境所選擇,而這個案例裡環境是人類,但沒有關係,人類也是世界的一部分。所以電腦當然在走一條演化之路。

但是它們沒有繁殖,沒有遺傳信息重組,這種演化方式和活著的生物是不一樣的。樂器也在演化,但它們沒有繁殖,只是被人造出來。電腦也是如此。

如果電腦變成了自律的實體,開始自己繁殖,相互競爭求生存,那麽這裡發生的事情就更加接近生物的演化。這時,你就會有情緒產生了。情緒是來自於保護自己、保護在乎的實體,保護家人和朋友,在電腦擁有朋友之前,它們是不會有情緒的。而現在的電腦沒有朋友,不會喜歡誰、討厭誰。這不是它們世界的一部分。必須要有保護,關懷和共情,需要能認同他人的目標、視之為自己的目標

我們距離這一切,還很遠很遠

作者Ent與侯世達的合影 | 圖片來源:Ent

排版:Ruiying

題圖來源:圖蟲創意

文章來源:本文經授權轉載自公眾號“果殼”,轉載請聯繫原账號。

歡迎個人轉發到朋友圈

微信:SquirrelClub

微博:科學松鼠會

科學松鼠會,是一家以推動科學傳播行業發展為己任的非營利組織,成立於2008年4月。我們希望像松鼠一樣,幫助公眾剝開科學的堅果,分享科學的美妙

喜歡記得點“在看”

獲得更多的PTT最新消息
按讚加入粉絲團