人類語言：一座人工智能至今無法跨越的大山

隨著網絡、社交媒體的普及以及人工智能的興起，語言所發揮的面對面的溝通功能大幅降低。這不禁讓我們反思，人究竟是何物。

前不久，國際知名語言學者王士元先生應邀在華東師范大學“思勉人文講座”上發表演講。他指出，語言是人類最重要的指標——它不僅是人類和動物的分水嶺，也是人工智能至今仍無法讓電腦掌握的能力。

原文：《“語言是人類最重要的指標”》

作者：加州大學伯克利分校榮休教授、香港理工大學講席教授王士元

“人是何物”最關鍵的回答

法國畫家保羅·高更提出的三個問題“我們從何處來、人是何物、向何處去”，都與語言密切相關。語言是人類最重要的指標——它不僅是人類和動物的分水嶺，也是人工智能至今仍無法讓電腦掌握的能力。

人是從哪裡來的？第一，約600萬年以前，人類與大猩猩開始分家；約350萬年以前，南方古猿開始出現；約280萬年以前，生物分類學上的人屬開始出現；約15萬年以前，智人種開始出現並成為現在人科人屬中唯一幸存的種，但智人曾和尼安德人、丹尼索瓦人等其他人種有過基因交流。第二，直立行走是促進人類演化的重要標誌，它有利於手腳分工、使用工具，有利於視野開闊、大腦發展，有利於喉頭下降、促進言語發聲。第三，儘管基因高度趨同，但和其他靈長類動物相比，人類具有以下顯著特徵：其一，直立行走、手腳分工；其二，腦容量大，約1400 cm3；其三，能使用語言，擁有高級思維，這其實也是對“人是何物”最關鍵的回答——人是有語言的動物！

於外，語言是我們溝通交流最重要的工具；於內，語言是我們思維最基本的載體。但在論述語言的特徵、起源與譜系之前，我們先了解一下其他動物的溝通方式。

研究其他動物的行為、感知和溝通方式，對我們了解智能很有必要。比如德國的Karl von Frisch就率先發現了蜜蜂的舞蹈語言：蜜蜂能夠利用∞形舞（亦稱“擺尾舞”）的頻率與角度傳遞蜜源的距離和方位資訊；不同地區蜜蜂的擺尾舞有不同的舞蹈形狀和時間節奏。

奧地利的Konrad Lorenz發現，剛出生的小鴨子是通過“印刻行為”（imprinting）找媽媽的，即它們會把看到的第一個能動的物體當做自己的媽媽。

英國的Peter Marler研究了同一座山中的白冠帶鵐和北美歌雀它們的雛鳥如何學會各自屬種的鳴叫。結果表明，鳥類習得鳴叫和人類習得語言存在兩大相似點：一是習得時都存在時間限制，即關鍵期（criticalperiod），對白冠帶鵐而言大約是出生後前50天。二是習得前都存在學語期，嬰兒是牙牙學語（babbling），雛鳥是吱呀初鳴（subsong）。

而新近的研究，如Virginia Morell（2014）在Science第344期上發表了論文“When the bat sings”，證實了蝙蝠也擁有非常複雜的、有規律的溝通系統。關於動物的溝通方式我們不再做過多介紹，如果有興趣可以參看我1991年主編的The Emergence ofLanguage: Development and Evolution（《語言湧現：發展與演化》王士元主編、林幼菁譯，2008）。

語義系統：人工智能的關鍵難題

人類主要依靠語言進行溝通，那麽語言具有什麽樣的特徵呢？1960年，美國語言學家Hockett在Scientific American第203期上發表了論文“The origin of speech”，文中他提出了13種設計特徵（design feature）來闡釋人類語言的獨特性：聲耳管道、四散傳播定向接受、迅速消失、互換性、整體反饋、專門化、語義性、任意性、分離性、跨越時空、能產性、傳統傳播和模式二重性。通過比較人類和其他動物溝通方式所利用的特徵差異，他認為，只有人類語言才能涵蓋全部設計特徵。　　

其中，任意性（arbitrariness）是人類語言一個很重要的基本特徵，即語言符號的音義結合關係是任意的、約定俗成的。戰國荀子早已提出類似的洞見：“名無固宜，約之以命，約定俗成謂之宜，異於約則謂之不宜”、“名有固善，徑易而不拂，謂之善名”。當然，這種“任意”並非“完全、絕對任意”。如圖1所示，假設有一個大家都不會說的語言中有兩個詞：kiki和booba，它們各自指稱的是左圖還是右圖呢？如果拿這個圖詢問不同語言背景的受試者，許多人會認為kiki指稱左圖，booba指稱右圖；因此，語音和語義之間還是可能存在某種關係的。加州大學聖地亞哥分校的Ramachandran 和Hubbard（2001）在Journal of Consciousness Studies 上發表了論文“Synaesthesia: A window into perception, thought and language”，他也舉了很多例子來說明語音和語義之間的結合關係並不是完全任意的。

當然，我個人認為還有一個雖未被Hockett提及但也與語言密切相關的特徵，就是“歧義（ambiguity）”。漢語中就有許多這樣的例子。比如“雞不吃了”就可以有兩種解讀：“不吃雞了”和“雞不吃東西了”，前者將“雞”理解為“吃”的受事，後者則理解為“吃”的施事。再如“我們沒有做不好的事情”也存在兩種歧義理解：一種是“我們沒有做壞事”，另一種是“沒有什麽事情是我們做不好的”，分歧在於“做”與“不好”的結合關係。

其他語言中的歧義句也不勝枚舉。比如英語It’s too hot to eat中的it可以有不同的指稱，hot也有兩個基本義項（熱和辣），故組合起來就可能有不同的涵義。再如日語“學生が好きな先生”也有兩種意思，即“喜歡學生的先生”，“學生喜歡的先生”。所以，人類語言高維的、複雜的語義系統也是當前人工智能領域所面臨的關鍵難題。

另外需要強調的是，語言並不是一種特殊的器官，而是建立在很多已有能力基礎上的。1962年，人工智能領域的開拓者之一Herbert Simon就曾經指出：只有等到動力系統中不同的功能（如呼吸、發聲、咀嚼等）互動在一起並同步化，語言才能獲得原動力（initial boost），人也才能擁有複雜的思想。1978年，我在印度的一次題為“Explorations in language evolution”的講演中也提出了類似的主張：“在人類演化中，這些能力也許比語言更早出現，漸漸一步一步地，這些能力在語言精練的過程中越來越為人所運用，好像完成了一片片的馬賽克拚貼畫一樣。同樣地，這些能力也被運用在其他精細的人類組織中，特別是在數學與音樂方面。”

語言的起源更可能是“多源的”

和人類起源理論一樣，語言起源理論也存在“單源論”（monogenesis）和“多源論”（polygenesis）的爭議。但語言起源的性質可能和人類起源不大一樣。　

作為一個物種，人類的起源更可能是“單源的”。從化石證據上看，迄今發現的最早階段的人類化石大多在非洲（如“少女Lucy”遺骸）。而從基因證據上，目前母系和父系的DNA研究也都支持“非洲起源假說”（The Out of Africa Hypothesis）。

線粒體DNA的結構類型是反映母系脈絡的重要指標。1987年，我在伯克利指導的研究生Rebecca Louise Cann及其同伴在Nature第325期上發表論文“Mitochondrial DNA and human evolution”，她提取並比較了胎盤中的線粒體DNA，結果顯示：在140多個胎盤中，最早開始分化的7個全部為非洲裔。

Y染色體（Y chromosome）則僅表現為父系遺傳。斯坦福大學的研究人員（Underhill、Shen、Lin等，2000）在Nature Genetics第26期上發表了論文“Y chromosome sequence variation & the history of human populations”。他們從Y染色體的序列變異中考察了人類父系脈絡的譜系，結果與母系線粒體DNA的考察結果類似，最先分出來的8個Y染色體也全部為非洲裔，這再一次佐證了“非洲起源論”的合理性。在此基礎之上，他們首次繪製了全球的人類演化遷徙地圖，並認為，大約在10萬年前，現代人從起源地非洲開始四散遷徙，並在不同的時間到達不同的區域。

相較於人類的起源，我認為語言的起源更可能是“多源的”。1996年，Freedman和我在Anthropological Science第104期上合著過一篇文章“Language Polygenesis: A Probabilistic Model”，文中用統計學上的泊松模型來比較單源和多源的概率，結果是更支持語言多源論。

但無論單源或多源，現在世界上約有六七千種語言，如何將它們組織起來並歸類呢？著名語言學家Greenberg在語言譜系分類上就作出了有益的嘗試。他的分類體包括12個大語系：克瓦桑語系、尼日爾-剛果語系、尼羅河-撒哈拉語系、德拉威語系、亞非語系、達羅毗荼語系、卡特維利語系、歐亞語系、得內-高加索語系（包括漢藏語）、南方語系、印度洋-太平洋語系、澳大利亞語系和美洲印第安語系。他認為，世界上為數眾多的語言都是從這幾大語系中發展出來的。而通過觀察同一語系（如得內-高加索語）在世界範圍內不同地域的分布，也能佐證這些區域的人存在親緣關係。因此，語言和化石、基因一樣，也是考察人類親緣譜系關係的重要證據。

下面討論一下歐亞語系中的印歐語及其分支的譜系研究。西方學界普遍認為現代語言學發軔於印歐語的歷史比較研究。英國法官William Jones首次發現印度的梵語和他所熟知的歐洲諸語間存在諸多類似之處，因此斷言這些語言同源。

其後，一代代學者繼續沿著他的路線探索印歐語的親屬關係及傳遞過程。其中有兩位德國語言學家August Schleicher和Johannes Schmidt相繼提出了兩大經典理論：前者首倡“時間-縱向傳遞-樹形圖理論”，後者則力主“太空-橫向傳遞-波浪理論”。基於這些研究，我們可以從原始印歐語（Proto-Indo-European，簡稱PIE）中派生出來144種語言及彼此的親緣關係。Gray 和Atkinson更進一步量化了歐洲諸語言的分化時間，其主要的量化依據就是詞，因為親屬語言間往往具有共同的詞匯、相近的形態及嚴整的語音對應規律。比如德國著名的語言學家Jacob Grimm就發現了三個有關印歐語輔音遞變的現象，被稱為“格林姆定律”（Grimm’s law），這三條規律能很好地勾勒出“原始印歐語（PIE）→日耳曼語”的演變過程。

“人是何物”？我們在人類與其他動物溝通方式差異的比較中作出了最關鍵的回答“人是有語言的動物”、“語言是人類最重要的指標”，其後又討論了語言的基本特徵、語言的起源與譜系等相關問題。不過，知識總是在進步的，今日的理論，很可能明日就被新的發現或想法所取代，這一點是我們必須始終留意的。

（本文根據王士元先生的報告錄音和PPT整理而成，內容有刪改，題目與小標題為編者另加。華東師范大學思勉人文研究院博士張明輝整理。）

文章原載於社會科學報第1606期第5版，未經允許禁止轉載，文中內容僅代表作者觀點，不代表本報立場。

今日

關注