每日最新頭條.有趣資訊

不止會下棋,“阿爾法狗”背後團隊或解開糖尿病等病症之謎

對於許多人來說,2016年“阿爾法狗”對陣世界圍棋冠軍李世石的世紀之戰可能還歷歷在目。而現在,這家“阿爾法狗”背後的人工智能企業DeepMind正在又一次創造歷史——

這次,他們不再局限於與人類在競技體育上一爭高下,而是直接將目光投向了目前科學領域最棘手的問題之一:預測蛋白質。

實際上,在此前,對於人類研發治療阿爾茨海默症、糖尿病藥物時,蛋白質折疊一直是個大問題,曾經也有科學家嘗試用超級電腦折疊蛋白質,但是效果並不是很理想。

據《衛報》報導,就在12月2日,在墨西哥坎昆舉行的一場國際會議上,DeepMind最新人工智能程式AlphaFold(阿爾法折疊)被確認,在根據基因序列預測出蛋白質的3D形狀這項任務上擊敗了所有競爭者,最終預測準確率超過一半。

“AlphaFold是該公司首個證明,人工智能研究可以驅動和加速科學新發現的重要裡程碑,” DeepMind方面表示。

此前,科學家發現了一種蛋白質是乳腺癌生長和擴散的關鍵驅動因素 圖據衛報

“蛋白質折疊界的奧運會”取得驚人成績

實際上,早在2016年,DeepMind開發的程式AlphaGo擊敗世界圍棋冠軍李世石之後,開發團隊就已經將目光投向了研究蛋白質折疊的領域。

儘管圍棋之類的遊戲已經被證明是一種對於AI程式功能的極好測試方式,但是對於研發團隊來說,在這些項目上與人類一爭高下顯然不是他們的最終目的。

“與世界冠軍下圍棋的意義,從來不在於贏得比賽本身,最終目的是為了發展算法,解決像蛋白質折疊這樣的問題。” DeepMind聯合創始人兼首席執行官戴米斯·哈薩比斯(Demis Hassabis)表示。

阿爾法狗與李世石的對弈 圖據美聯社

而這一次,DeepMind讓AlphaFold參加了結構預測(CASP)的關鍵比賽,這是一項每兩年舉辦一次的,堪稱“蛋白質折疊界的奧運會”,吸引了來自世界各地的研究團隊。

這一比賽的目的是為了從他們的氨基酸列表來預測蛋白質的結構。此前,這些列表已經在比賽前幾個月時間中,每隔幾天發送給參賽的團隊。在比賽最終結束前,這些蛋白質的結構已經通過費力又費錢的傳統方法破解,但還沒有公開,最終提交最準確預測的團隊將獲勝。

儘管這次是AlphaFold首次參賽,但是,它取得了驚人的成績——

在發給比賽團隊的43種蛋白質中,AlphaFold有25種預測最接近正確結果;而在同一類別中排名第二的選手,僅在43種蛋白質中,有3種結果預測的最接近正確結果。

與此前的“阿爾法狗”相同的是,AlphaFold構建的模型都依賴深度神經網絡,這些經過訓練的神經網絡可以從基因序列中預測蛋白質的屬性。

在構建的過程中,DeepMind在數千已知的蛋白質上訓練了一個神經網絡,直到它可以僅憑氨基酸預測蛋白質的3D結構。此後,給定一種新的蛋白質時,AlphaFold可以利用神經網絡來預測氨基酸對之間的距離,以及連接它們的化學鍵之間的角度,最後調整初步結構以找到能效最高的排列。

根據DeepMind在官方部落格中針對AlphaFold發布的科普性文章,他們這樣解釋道:“我們訓練了一個神經網絡,來預測蛋白質中每一對殘基之間的距離分布,然後將這些概率打成一個分數,用這個分數來評估預測的蛋白質結構有多準確;我們還訓練了一個單獨的神經網絡,用來估計建議預測結構和實際結構之間的差距。”

據悉,在項目之初,AlphaFold花了兩周時間來預測其第一個蛋白質結構。但現在,這一工作在幾小時內就可以完成。

一種用AI算法做出的動畫,用於預測CASP13目標T1008的結構 圖據DeepMInd官網

或助人類探明糖尿病等病症原因

那麽,預測蛋白質折疊對於人類醫學,為何如此重要?

據《衛報》介紹,蛋白質折疊是一種令人難以置信的分子折疊形式,其神秘本質很少在科學界之外得到討論,因此對於許多人來說是一個顯得有些陌生的詞匯。

但是,這其實是一個極為重要的問題——生物學的機制由蛋白質構成,蛋白質的形狀決定了它的功能。

生物學上來說,人類可以製造大量不同的蛋白質,估計數量從數萬到數十億不等,但都是由20種不同的氨基酸連接形成的多聚體。蛋白質可以在每一種氨基酸之間扭轉和彎曲,因此可能呈現出數量驚人的不同結構,可以達到1後邊跟著300個零這樣龐大的數字。

蛋白質的三維形態取決於它所含氨基酸的數量和類型,而這一形狀也決定了它在人體中的作用,人體幾乎所有的功能,從肌肉緊張、感知光線到將食物轉化為能量,都可以追溯到蛋白質的形狀和運動。

在通常情況下,蛋白質會行成對其來說最節能的形狀,但是它們仍然可能糾纏在一起,折疊不當,進而導致糖尿病、帕金森症及阿爾茨海默症等疾病。

這意味著,如果科學家能夠從蛋白質的化學組成中,預測出蛋白質的形狀,就能夠搞清楚它的作用,以及它是如何扭曲並產生傷害,並設計出新的蛋白質來對抗這些疾病。

“如果了解蛋白質是如何折疊的,研究人員就能開創一個科學和醫學進步的新時代。”《衛報》介紹稱。

DeepMind部落格原文 圖據DeepMind官網

“目前我們只是邁出了第一步”

首次涉足蛋白質折疊領域的成功表明,機器學習系統可以整合各種資訊來源,幫助科學家快速找到各種複雜問題的創造性解決方案。人工智能已經通過AlphaGo等系統掌握了複雜的遊戲,與此類似,利用人工智能攻克基本科學問題的未來同樣值得期待。

DeepMind聯合創始人哈薩比斯表示,這是一個非常關鍵的時刻。“這是一個堪稱引領性的項目,我們將優先在這一基本的、極為重要的、具有現實意義的領域投入精力。”

但是,儘管取得了比賽的勝利,哈薩比斯坦言,要做的工作還有很多,“我們談不上解決了蛋白質折疊的問題。目前,我們只是邁出了第一步。這是一個極具挑戰性的問題,我們有一個良好的體系,還有很多想法尚未付諸實踐。”

紅星新聞記者丨翟佳琦 編譯報導

獲得更多的PTT最新消息
按讚加入粉絲團