每日最新頭條.有趣資訊

哈佛研究員解讀DeepMind突破:有進步 但未解決根本問題

前不久,DeepMind放出大招AlphaFold。在“蛋白質結構預測奧運會”CASP13比賽中,力壓其他參賽者。

那麽,DeepMind這項研究到底意味著什麽?會帶來什麽樣的影響?

作為業內人士,哈佛醫學院系統生物學研究員Mohammed AlQuraishi對其進行了解讀。他博士畢業於斯坦福大學,參加了CASP13,是AlphaFold大放異彩的見證者。

他認為,AlphaFold有進步,但並沒有解決根本的問題。不過,它在生物化學中最重要的問題之一上取得了重大進展,大家應該為此感到高興。

此外,AlphaFold推出之後,也引發了外界的質疑,不少人都認為這是一個高超的工程技術,並不能稱得上是一個基礎的科學見解。 AlQuraishi認為,AlphaFold兩者兼具。

解讀文章發表之後,引發了不小的關注。不少業內人士發表評論稱,這是目前關於AlphaFold的最好的一篇解讀。

AlphaFold有進步,但沒有解決根本問題

從AlphaFold給CASP成績帶來的提升來看,的確是取得了進步。但這個進步,是學術研究的自然增長,還是AlphaFold依靠自身能力帶來的呢?這是一個非常容易忽視、且容易引發分歧的問題。

上圖中,呈現了每屆CASP第一名和第二名的成績,虛線代表著CASP13預期成績,是根據CASP10到12的平均改善率預測的。

在CASP 10之前,整個增長曲線10年來基本上是平緩的。CASP11的提升,是因為引入了協同進化的方法。CASP 12帶來的提升,是這些方法最終被證明了。即使沒有AlphaFold,CASP13的成績,也會因為在協同進化方法中廣泛應用深度學習,出現進一步的提升。

AlphaFold的意義,在於取得了更大幅度的提升。從圖中可以看出,第二好的方法,基本上和預計的差不多,而AlphaFold又在這個基礎上提升了不少。

因此,可以說AlphaFold取得了實質性進展。

但這是否就意味著問題已經解決了,或者說解決得差不多了呢?答案依舊是否定的。 AlQuraishi表示,AlphaFold的技術還沒有到達那一步。

如果按照AlphaFold這樣的發展勢頭,四年內就能夠達到真正解決問題的地步。當然,這是以發展勢頭能夠持續為前提的。但如果沒有新的概念突破,就沒有任何理由能夠證明,這個勢頭是可持續的。

一個有趣的假設是,如果其他有一個學術團體取得了與DeepMind相同的成果,會不會引發同樣大的關注?答案當然是否定的。從CASP11 CASP12的進步中就證明了這一點,當時的進步並不比這一次差,但新聞報導寥寥無幾。

毫無疑問,DeepMind的影響力與受關注度,發揮了很大的作用,當然,這對整個領域的發展也有很大的幫助。

此外,AlQuraishi認為人們對DeepMind帶來的進步過於樂觀了,這是他們第一次進入這個領域,優秀的工程附加價值可能不會重復出現。

但不論如何,DeepMind都給當前的研究格局帶來了極大的衝擊。AlphaFold推出之後,CASP13上討論最多的一個問題就是,這是學科基礎的突破,還是DeepMind依賴高超的工程技術帶來的突破?

學科基礎的突破還是高超的工程技術?

AlQuraishi認為,這個問題非常愚蠢,而且也會引起分歧。如果非要回答這個問題的話,兩者兼有。

從學科基礎突破方面來看,DeepMind有很多不錯的想法。

首先,他們不僅預測了這些氨基酸的化學鍵之間連接的角度與相互作用,還預測了成對的氨基酸之間的距離。

雖然說之前也有學者採用了相同的方法,但多重跡象表明,兩個團隊是獨立發展出這個想法的。至關重要的是,AlphaFold還進一步預測了距離分布。根據DeepMind官方部落格的資訊:

他們訓練了一個神經網絡來預測蛋白質中每對殘基之間的距離分布。然後,將這些概率組合成一個分數,用來估計一個蛋白質結構的準確度,又另外訓練了一個單獨的神經網絡,基於所有距離的總和來評估初步給出的蛋白質結構與正確答案的接近程度。

其次,AlphaFold在進一步預測蛋白質結構的時候,還運用到了勢函數相關的知識。根據參考狀態,把用神經網絡生成的勢函數中的勢進行歸一化。再用另一個獨立運行的算法把它最小化,進而生成蛋白質折疊。

雖然這些想法看上去非常簡單,但科學不就是用簡單的想法產生深遠的影響嗎?

當然,DeepMind也利用了他們在機器學習方面深厚的專業知識。例如,分布預測的想法與他們在一年前發表的關於分布強化學習的論文有點相似。

這對AlphaFold有沒有影響不得而知。但可以確定的是,機器學習和蛋白質兩個領域的專業知識結合對於實現這些進步有很大的幫助。

在工程方面自是不消多說,現在大家看到的任何“優雅”的解決方案,都是多次試錯的結果,這很大程度上取決於計算能力和人力資源。

學術團體的危機:到底發生了什麽?未來怎麽辦?

很多相關的研究學者,尤其是參加CASP13的學者,看到DeepMind的研究成果,都有一種存在主義的焦慮感。

非常具有諷刺意義的是,這些學者的目標就是要淘汰蛋白質晶體研究者,現在也在擔心自己被淘汰。

AlQuraishi認為,大多數人都經歷了以下的幾個階段:

一開始,擔心DeepMind團隊憑借著一些卓越的洞察力,加上頂尖的工程技術,超越了我們所有人;

然後,看到他們的見解與大多數人的想法並沒有太多的不同,就松了一口氣;

進而開始貶低DeepMind的貢獻,並將其取得的成功,歸功於Alphabet掌握的資源。

撇開上述觀點的有效性不談,他們潛在的擔憂是,蛋白質結構預測作為一個學術領域,是否會像機器學習一樣,最好的研究將會在工業界的實驗室中誕生,而學術團體只能夠分食剩下的殘渣。

說實話,這個問題沒有答案。這個設想也是未來可能出現的情景。隨著DeepMind的加入,學術界的研究者這不得不考慮這一點。

關鍵是,學術研究團體,是否應該就此放棄他們的蛋白質結構研究項目,轉向其他領域?換了新的領域,是不是還會有其他的科技公司進入,繼續壓迫他們的研究空間?就這些問題,AlQuraishi給出了自己的一些想法。

最重要的一點是,應該意識到DeepMind的進入,是一件不可預測的好事。推動了整個科學界在生物化學最重要的問題上取得了重大進展。是誰取得了進展不重要,重要的是取得了進展。

而且,DeepMind的進入也表明了現在有了新的、世界一流的研究團隊在這個領域投入資源,並於現有最優秀的團隊進行競爭。如果這樣的情況每十年發生一次,我們應該張開雙臂歡迎。

我們也應該鼓勵他們像學術團體一樣,公開分享他們的研究成果,學術團體也可以像他們學習如何改進工程實踐。

更何況,DeepMind也提高了蛋白質結構問題的知名度,也會激勵大量的人們進入這個領域。

面對DeepMind,最好的方法,就是的適應。就像人工智能領域一樣,學術團體應該把目光放在對資源要求較低,需要關鍵概念突破才能帶來進展的問題上。就蛋白質結構預測而言,這是一個多重的問題,真正解決這個問題,需要協同的方法。

此外,AlQuraishi也透露了DeepMind在AlphaFold上後續的動向,並表達了自己看法:

DeepMind已經承諾了要發表一篇關於AlphaFold的論文,最終和確切的描述還要看他們的論文。不過,他們並沒有發布源代碼的計劃,短期內也不太可能建立一個公開的預測伺服器。

話雖如此,但他們在CASP13期間樂於討論他們的方法,並且似乎真的有興趣與社區分享這種方法,並希望其他學者能夠在此基礎上進一步發展。我的感覺是,他們是為了科學。

你怎麽看?

傳送門:

https://moalquraishi.wordpress.com/2018/12/09/alphafold-casp13-what-just-happened/

活動報名

加入社群

量子位AI社群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字“交流群”,獲取入群方式;

此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字“專業群”,獲取入群方式。(專業群審核較嚴,敬請諒解)

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復“招聘”兩個字。

獲得更多的PTT最新消息
按讚加入粉絲團