每日最新頭條.有趣資訊

以碼抗病:計算機如何輔助抗病毒藥物研發

文章來自“科學大院”公眾號

作者:學CADD的蛋

我原以為,這依然會是一個尋常的寒假。

直到疫情的形勢愈發嚴峻。

對病毒各類蛋白的調研任務分配到遠在五湖四海的每個實驗室成員頭上。沒有瓶瓶罐罐,沒有五花八門的試劑,沒有昂貴精致的儀器。一台能遠程連上伺服器的電腦,這便是我所擁有的全部。

很多人以為,藥物的研發只有在穿著白大褂的實驗室裡可以做。然而,隨著近十餘年,各類理論方法、計算機硬體、及工業和學術專業軟體的發展與成熟,計算機輔助藥物設計(Computer-Aided Drug Design, CADD)的方法已日趨成熟,其應用極大地加快了新藥研發的速度與效率,已成為現代藥物研發的常規方法之一[1]。

依賴於這樣的技術,即便我足不出戶,在家遠程工作,也能為尋找治療此次病毒感染的潛在藥物貢獻自己的力量。

尋找關鍵蛋白質

蛋白質是生命的物質基礎,是組成細菌、病毒及動植物的一切細胞、組織的重要成分。各類功能性蛋白質在機體中各司其職,維系著整個機體的正常運轉。

以病毒為例,病毒是由核酸(DNA或RNA)與蛋白質構成的非細胞形態,介於生命體與非生命體之間,無法自我複製與繁殖,需要寄生在活的宿主細胞內,依賴於宿主細胞的原料、能量供給與場所,完成自我的複製與釋放[2]。這一過程就好比一個A國的賣假鈔的罪犯(病毒),本身沒有印製A國貨幣的能力;但當他侵入B國的印鈔廠(宿主細胞)後,他就能調用B國工廠的所有資源,來印製A國的貨幣(病毒的核酸與蛋白)。

病毒的生命周期需要經歷吸附、侵入、脫殼、生物合成、組裝和釋放等六大步驟[2],病毒的各類功能性蛋白在這些步驟中分工明確、高度協作,從而才能完成從感染宿主細胞到複製病毒的整個周期。目前,研究人員已從新型冠狀病毒(2019-nCov)中分離出orf1ab, S, E, M, N等10條基因組序列,各自編碼相應的病毒蛋白。

通過與同為冠狀病毒的SARS病毒類比,我們可以合理地推測出新型冠狀病毒基因編碼的各類蛋白質的功能。舉例來講,如,orf1ab基因編碼orf1ab多聚蛋白,參與病毒RNA的轉錄與複製,並具有蛋白酶、甲基轉移酶等多個功能;S基因編碼冠狀病毒的表面糖蛋白,也稱為棘突蛋白(Spike Protein),通過與人體內的ACE2蛋白質結合,直接介導病毒對宿主細胞的感染及融合,這類蛋白如同日冕般分布在病毒的包膜上,“冠狀病毒”由此得名。這些功能性蛋白質對病毒的感染與複製發揮著重要的作用,單獨或同時干擾其中的一個或多個蛋白質的功能,抑製其活性,便能阻斷病毒感染宿主細胞或在宿主細胞內自我複製的進程,從而起到治療的效果。

因此,一旦獲取了病毒蛋白質的晶體結構,基於前期對其功能的了解,我們便能利用計算機輔助藥物設計的技術,針對性地尋找潛在的有效藥物。那麽,這一過程是如何進行的呢?

魚與刀,鎖與鑰匙

若是“以貌取物”的話,在以“光滑彈嫩”為美的今天,蛋白質表面坑坑窪窪,“長得”可實在不算漂亮。可恰是這些坑坑窪窪的空腔,才是真正暗藏玄機的地方。

以SARS病毒orf1ab多聚蛋白中的一段,3C-like蛋白酶,也稱Mpro蛋白為例。這一蛋白主要負責將多聚蛋白水解為功能性的多肽,以發揮其各自的功能;就好比做魚的時候,用一把鋒利的刀把整條魚除鱗去髒,並分為魚頭、魚身、魚尾,分別預備燉湯、紅燒、清蒸一樣。這一蛋白酶的活性位點,就好比是這把菜刀的刀刃,就藏身於蛋白質表面的空腔(口袋)中(圖2)。

圖2. 坑坑窪窪的SARS Mpro蛋白表面(白色)及其蛋白酶活性位點口袋(紅色圓圈),PDB編號2GX4[3]

篩選或合成得到的具有生物活性的小分子可以很好地結合在這一活性位點的口袋中(圖3),從而抑製蛋白酶的活性,阻止其將多聚蛋白切割為功能性多肽,從而阻止這些多肽在後續病毒的複製和感染中發揮功能。就好比沒收了這把切魚的刀,或者在刀刃上套了一層使其鈍化的保護套,使其無法處理這條魚,從而無法進行後續的烹飪。

圖3. SARS Mpro蛋白表面(白色)及文獻報導的抑製劑(綠色棍裝),PDB編號2GX4[3]

對每一個蛋白質,尋找具有令人滿意的生物活性的分子的過程,就好比是面對一把精美絕倫的鎖,需要找到一把同樣精美絕倫的鑰匙,來與之緊密契合。而計算機輔助藥物設計所需要做的,就是以高效和低成本的方式,去找到這樣一把合理的鑰匙;即,基於對蛋白質功能的前期了解,及對蛋白質結構的系統分析,通過計算的方式,評估各類分子在蛋白質口袋中的結合強度和作用模式,從而篩選或設計出最有可能成為蛋白功能抑製劑(或激動劑)的分子。

計算機輔助藥物發現

不幸的是,儘管近年來相關技術飛速發展,但找到這樣一把精美絕倫的鑰匙絕非易事。一個新藥從研發到上市往往需要消耗數十年的時間和數以十億計的美金[4]。但好消息是,總有這樣幾把鎖長得有點像,其鑰匙可以通用,就像艾滋病蛋白酶的抑製劑可能可以作用於冠狀病毒的蛋白酶(如奈菲那韋和洛匹那韋),負責埃博拉或流感病毒RNA複製的RNA聚合酶(RNA-dependent RNA polymerase,RdRp)抑製劑可能可以作用於冠狀病毒的RdRp一樣(如法匹拉韋和瑞德西韋)[5]。

面對急性爆發的疫情,從已上市或已在臨床上的“老藥物”中尋找合適的分子顯然是相比從頭研發新的分子更具時間優勢的策略。運用計算機輔助藥物設計,基於一種叫做分子對接(molecular docking)的技術進行虛擬篩選(virtual screening),我們可以模擬出每個“老藥”分子在病毒蛋白質口袋中的結合構象,通過打分函數、自由能計算等方式評估其理論上的結合強度,從而分析該分子成為潛在抑製劑的可能性。就好比當我們已知“鎖”的構造時,運用這樣的技術,可以不必親自把每把鑰匙都在鎖孔裡插一遍來尋找能開鎖的那把;通過計算機模擬分析的方式,篩選出最可能打開鎖的幾把鑰匙,而後隻對這幾把鑰匙進行測試就可以了。

甚至於,利用同源模建(homology modeling)的技術,我們甚至可以不用知道當前病毒蛋白這把“鎖”的構造,在僅有蛋白質氨基酸序列的情況下,構建出病毒蛋白質結構可能的模型,從而提交虛擬篩選作業。儘管據早期的新聞報導,2019-nCov病毒和SARS病毒在基因組水準的相似度只有70%,但事實上,通過對病毒蛋白的序列比對可以發現,此次新型冠狀病毒的某些關鍵蛋白和SRAS病毒的氨基酸同源性能達到95%以上(例,圖4)。因此,依賴於蛋白質晶體結構數據庫(Protein Data Bank)中,早年研究SRAS病毒時獲得的SARS病毒蛋白的晶體結構,我們便可以構建出合理的2019-nCov的相應蛋白質的結構。

因此,對急性爆發的疫情,當結構生物學等基礎研究來不及跟上;當病毒毒性太大,實驗室條件受限、滿足生物安全要求的實驗室較少;或者當待測試分子過多,人員不足,成本過高時,計算機輔助的方式都不失為一種高效的策略,為活性分子的發現與機制探索提供寶貴的建議,從而為特效藥物的研發贏得寶貴的時間。

寫在最後的話

我自寒假的第三天開始在家參與此次新型冠狀病毒的相關工作,至今已過去約兩周的時間。無疑,在博士求學生涯即將結束的階段,這是我度過的最充實、也是最緊張的一個假期。

但正如前文所述,藥物研發,絕非易事。就像早先一些學者所說的“不管疾病有多嚴重,不管我們期待新藥和新疫苗的願望是多麽迫切,新藥和新疫苗開發的規律無法被逾越。”[6]藥物研發有其固有的規律,絕非人的意志可以轉移。儘管如前所述,現今已有多個藥物在進行臨床或臨床前研究[5],但保護好自己不受感染依然是每個人的當務之急。

所幸相比17年前,我們現在有了天河,有了神威,用於蛋白體系模擬的算力早與當年不可同日而語,一個又一個課題組及科研工作者,毫不猶豫地犧牲了自己的休息時間參與此次突破。

也許就像高中政治課本裡所說的那樣吧:“道路是曲折的,前途是光明的!

(2020年2月寫於等伺服器計算結果的間隙)

作者系中國科學院藥物研究所在讀博士

科學大院是中科院官方科普微平台,由中科院科學傳播局主辦、中國科普博覽團隊運營,致力於最新科研成果的深度解讀、社會熱點事件的科學發聲。

獲得更多的PTT最新消息
按讚加入粉絲團