不止會下棋，“阿爾法狗”背後團隊或解開糖尿病等病症之謎

對於許多人來說，2016年“阿爾法狗”對陣世界圍棋冠軍李世石的世紀之戰可能還歷歷在目。而現在，這家“阿爾法狗”背後的人工智能企業DeepMind正在又一次創造歷史——

這次，他們不再局限於與人類在競技體育上一爭高下，而是直接將目光投向了目前科學領域最棘手的問題之一：預測蛋白質。

實際上，在此前，對於人類研發治療阿爾茨海默症、糖尿病藥物時，蛋白質折疊一直是個大問題，曾經也有科學家嘗試用超級電腦折疊蛋白質，但是效果並不是很理想。

據《衛報》報導，就在12月2日，在墨西哥坎昆舉行的一場國際會議上，DeepMind最新人工智能程式AlphaFold（阿爾法折疊）被確認，在根據基因序列預測出蛋白質的3D形狀這項任務上擊敗了所有競爭者，最終預測準確率超過一半。

“AlphaFold是該公司首個證明，人工智能研究可以驅動和加速科學新發現的重要裡程碑，” DeepMind方面表示。

此前，科學家發現了一種蛋白質是乳腺癌生長和擴散的關鍵驅動因素圖據衛報

“蛋白質折疊界的奧運會”取得驚人成績

實際上，早在2016年，DeepMind開發的程式AlphaGo擊敗世界圍棋冠軍李世石之後，開發團隊就已經將目光投向了研究蛋白質折疊的領域。

儘管圍棋之類的遊戲已經被證明是一種對於AI程式功能的極好測試方式，但是對於研發團隊來說，在這些項目上與人類一爭高下顯然不是他們的最終目的。

“與世界冠軍下圍棋的意義，從來不在於贏得比賽本身，最終目的是為了發展算法，解決像蛋白質折疊這樣的問題。” DeepMind聯合創始人兼首席執行官戴米斯·哈薩比斯(Demis Hassabis)表示。

阿爾法狗與李世石的對弈圖據美聯社

而這一次，DeepMind讓AlphaFold參加了結構預測（CASP）的關鍵比賽，這是一項每兩年舉辦一次的，堪稱“蛋白質折疊界的奧運會”，吸引了來自世界各地的研究團隊。

這一比賽的目的是為了從他們的氨基酸列表來預測蛋白質的結構。此前，這些列表已經在比賽前幾個月時間中，每隔幾天發送給參賽的團隊。在比賽最終結束前，這些蛋白質的結構已經通過費力又費錢的傳統方法破解，但還沒有公開，最終提交最準確預測的團隊將獲勝。

儘管這次是AlphaFold首次參賽，但是，它取得了驚人的成績——

在發給比賽團隊的43種蛋白質中，AlphaFold有25種預測最接近正確結果；而在同一類別中排名第二的選手，僅在43種蛋白質中，有3種結果預測的最接近正確結果。

與此前的“阿爾法狗”相同的是，AlphaFold構建的模型都依賴深度神經網絡，這些經過訓練的神經網絡可以從基因序列中預測蛋白質的屬性。

在構建的過程中，DeepMind在數千已知的蛋白質上訓練了一個神經網絡，直到它可以僅憑氨基酸預測蛋白質的3D結構。此後，給定一種新的蛋白質時，AlphaFold可以利用神經網絡來預測氨基酸對之間的距離，以及連接它們的化學鍵之間的角度，最後調整初步結構以找到能效最高的排列。

根據DeepMind在官方部落格中針對AlphaFold發布的科普性文章，他們這樣解釋道：“我們訓練了一個神經網絡，來預測蛋白質中每一對殘基之間的距離分布，然後將這些概率打成一個分數，用這個分數來評估預測的蛋白質結構有多準確；我們還訓練了一個單獨的神經網絡，用來估計建議預測結構和實際結構之間的差距。”

據悉，在項目之初，AlphaFold花了兩周時間來預測其第一個蛋白質結構。但現在，這一工作在幾小時內就可以完成。

一種用AI算法做出的動畫，用於預測CASP13目標T1008的結構圖據DeepMInd官網

或助人類探明糖尿病等病症原因

那麽，預測蛋白質折疊對於人類醫學，為何如此重要？

據《衛報》介紹，蛋白質折疊是一種令人難以置信的分子折疊形式，其神秘本質很少在科學界之外得到討論，因此對於許多人來說是一個顯得有些陌生的詞匯。

但是，這其實是一個極為重要的問題——生物學的機制由蛋白質構成，蛋白質的形狀決定了它的功能。

生物學上來說，人類可以製造大量不同的蛋白質，估計數量從數萬到數十億不等，但都是由20種不同的氨基酸連接形成的多聚體。蛋白質可以在每一種氨基酸之間扭轉和彎曲，因此可能呈現出數量驚人的不同結構，可以達到1後邊跟著300個零這樣龐大的數字。

蛋白質的三維形態取決於它所含氨基酸的數量和類型，而這一形狀也決定了它在人體中的作用，人體幾乎所有的功能，從肌肉緊張、感知光線到將食物轉化為能量，都可以追溯到蛋白質的形狀和運動。

在通常情況下，蛋白質會行成對其來說最節能的形狀，但是它們仍然可能糾纏在一起，折疊不當，進而導致糖尿病、帕金森症及阿爾茨海默症等疾病。

這意味著，如果科學家能夠從蛋白質的化學組成中，預測出蛋白質的形狀，就能夠搞清楚它的作用，以及它是如何扭曲並產生傷害，並設計出新的蛋白質來對抗這些疾病。

“如果了解蛋白質是如何折疊的，研究人員就能開創一個科學和醫學進步的新時代。”《衛報》介紹稱。

DeepMind部落格原文圖據DeepMind官網

“目前我們只是邁出了第一步”

首次涉足蛋白質折疊領域的成功表明，機器學習系統可以整合各種資訊來源，幫助科學家快速找到各種複雜問題的創造性解決方案。人工智能已經通過AlphaGo等系統掌握了複雜的遊戲，與此類似，利用人工智能攻克基本科學問題的未來同樣值得期待。

DeepMind聯合創始人哈薩比斯表示，這是一個非常關鍵的時刻。“這是一個堪稱引領性的項目，我們將優先在這一基本的、極為重要的、具有現實意義的領域投入精力。”

但是，儘管取得了比賽的勝利，哈薩比斯坦言，要做的工作還有很多，“我們談不上解決了蛋白質折疊的問題。目前，我們只是邁出了第一步。這是一個極具挑戰性的問題，我們有一個良好的體系，還有很多想法尚未付諸實踐。”

紅星新聞記者丨翟佳琦編譯報導