每日最新頭條.有趣資訊

OpenAI能作詞,我們輸入吳亦凡的“大碗寬面”試了一把

幾十年來,機器一直在努力學習人類語言的微妙之處,深度學習的出現加速了這一進程。

今年2月,OpenAI發布了一款令人印象深刻的語言模型GPT-2,它可以寫短篇小說、詩歌,甚至輕鬆辨別《哈利波特》和《魔戒》中的角色。最近,一位加拿大工程師用它創建了一個向公眾開放的文本生成器,只需提供一個句子,機器便能自動生成一則完整的新聞、故事、歌詞、詩歌、食譜和代碼等文本。

我們用吳亦凡在綜藝節目《七十二層奇樓》中的一段freestyle(即興說唱)——“你看這個面它又長又寬,就像這個碗它又大又圓”進行了創作。一起來看看人工智能的freestyle水準吧。

芒果TV綜藝《七十二層奇樓》

人工智能版《大碗寬面》

這個名為talktotransformer的文本生成器由加拿大工程師亞當·金(Adam King)創建,它脫胎於OpenAI的大規模無監督語言模型GPT-2。talktotransformer使用的是GPT-2的精簡版本,這個版本過去隻開放給特定的科學家和記者。

在talktotransformer中輸入文本“你看這個面它又長又寬,就像這個碗它又大又圓”後,人工智能創作出的歌詞大意為:

你看這個面它又長又寬,

就像這個碗它又大又圓。

只需嘗一口,你就知道是面條。

我的臉上,露出懷疑的表情。

這是真的,我的碗它變成了面條。

這簡直太棒了。

當我回到家,我得到一些雞翅。

我怎麽會變得這麽好?誰知道呢?

我從朋友和家人那裡得到足夠的愛,

我的味蕾開始變大。

當我要吃飯的時候,

它不再只是食物,它是我的想法。

我想要吃好喝好的生活。

talktotransformer模型的輸出結果

通過閱讀上述由人工智能模型輸出的文字,我們很容易發現,機器輸出了一些看似語義完整的句子,但其中的意思卻讓人摸不著頭腦。這就是自然語言處理(NLP)的難題——由於缺乏常識,機器並不真正理解語言的含義。

就如2018年圖靈獎獲得者約書亞·本吉奧(Yoshua Bengio)在接受澎湃新聞(www.thepaper.cn)採訪時所言,目前的自然語言系統其實並不理解句子的真正含義,機器“會犯一些非常愚蠢的錯誤,甚至沒有兩歲小孩的理解能力”。

talktotransformer.com頁面

文思泉湧的OpenAI GPT-2語言模型

2019年2月,OpenAI發布了擁有15億參數的大規模無監督語言模型GPT-2,它擅長處理語言建模和文本預測任務,還具備閱讀理解、總結、翻譯等能力。只要給出一個開頭的句子,GPT-2就能生成一篇小文章、一則新聞故事,甚至在文本中使用引語和統計數據。如果給出的句子是一個短篇小說的開頭,它會告訴你接下來在這些角色身上會發生什麽事。

OpenAI 加利福尼亞州實驗室工程副總裁David Luan對美國科技媒體《邊緣》(THE VERGE)表示,GPT-2能寫出“非常合理的”、“稱職的”論文,“是可以提交給美國大學入學資格考試(SAT)並取得好成績的東西”。

GPT-2在人工智能社區引起了不小的關注,但OpenAI當時並沒有開源這個系統。一方面,研究人員對該算法能做什麽、不能做什麽尚不明確;另一方面,他們擔心這項技術被濫用——開源之後,如果有人向GPT-2提供種族主義、暴力、歧視女性或者辱罵性的文本,GPT-2將自動學習並持續地輸入類似的內容。

不開源的決定引發了人工智能社區的不滿,畢竟,開源是人工智能領域的優良傳統。也許是反對的聲音太大,OpenAI在5月初表示將逐步公開GPT-2,並開源了345M的預訓練模型。後續,OpenAI將分析該語言模型對社會的影響。

獲得更多的PTT最新消息
按讚加入粉絲團