每日最新頭條.有趣資訊

“垃圾基因”數據庫上線一個月 全球遺傳學家“路轉粉”

上線一個月就有來自22個國家的1446次訪問

“垃圾基因”數據庫收獲全球遺傳學家“粉絲”

生物前沿

吳 言 本報記者 劉志偉

“打個比喻,如果我們的遺傳信息是一座山,遺傳學家知道這山裡面有金子,但他們用的是鋤頭。我們的工作就是給他們打造‘挖礦機’,幫他們把這些金子更快地挖出來;並把我們已經挖到的東西展現出來,構建成資源庫,方便他們使用。”華中農業大學信息學院、生物醫學與健康學院教授龔靜這樣解釋他們的研究。

龔靜的團隊最近在英國《核酸研究》雜誌先後發表3篇文章。他們通過對多種癌症中遺傳變異的功能進行深入分析,發現了大量可調控非編碼核糖核苷酸(ncRNA)和可選擇性多聚腺苷酸化(APA)的遺傳變異位點,構建了在線數據庫,並開放給全球的研究者共享。

“其中一個數據庫上線1個多月,就已經有22個國家1446次的訪問了!”龔靜接受科技日報記者採訪時表示,她為自己的這一項研究能收獲世界各地的粉絲而感到欣慰。

從“垃圾基因”裡面“挖”寶

龔靜對其中一項研究進行了詳細的解釋,她說:“表達數量性狀座位(eQTL)是指基因組上可以影響基因表達的遺傳變異位點。eQTL分析是解析遺傳功能和尋找致病基因的重要方法之一,已廣泛用於遺傳研究中。”

基因分為編碼基因和非編碼基因。然而,目前大部分研究專注於編碼基因相關的eQTL鑒定, 非編碼相關的eQTL系統分析非常少。龔靜表示,非編碼比編碼基因數據更龐大。十年前大家覺得不重要,甚至有人把它稱為“垃圾基因”,但現在大家發現它有越來越多的功能,甚至參與到癌症的發生發展過程。

從事生物信息技術研究多年的龔靜,一年前正是看到了非編碼相關eQTL系統分析的欠缺,決定帶領團隊來填補這一空白。他們使用癌症基因組圖譜(TCGA)近1萬多個樣本的基因組和非編碼表達量信息,系統分析了33種癌症中遺傳變異與非編碼表達量之間的關係。

通過大樣本、多組學分析,在33種癌症中,他們一共鑒定得到與長非編碼相關的600多萬種順式eQTLs和70多萬種反式eQTLs。他們進一步將已鑒定的eQTLs和癌症病人生存信息關聯並分析後,確定了與患者總生存時間相關的8235個長非編碼RNA-eQTLs和116個microRNA-eQTLs。

在此基礎上,他們構建了一個在線數據庫。在這個網站上,其他研究者可以方便地瀏覽及查詢多種癌症相關的eQTL數據。

這些eQTL數據,將有助於理解遺傳風險等位基因如何促進腫瘤的發生和發展,幫助遺傳學家更好地認識非編碼基因在癌症進展中的作用和生物學機理,為潛在的癌症靶標的開發提供新思路。

還可以擴展到動物和植物

本科學醫和博士選擇生物信息學的背景,讓龔靜有了更多的跨學科思維。她認為,生物信息學家的一個重要責任就是為生物學家和遺傳學家,以及臨床工作者提供更方便的工具和數據資源。

龔靜說:“因為非編碼相關的eQTL研究很少,這也就意味著能供我們參考的研究方法也比較少,所以方法的選擇、數據的收集分析、相關數據庫的構建等需要我們知難而進。為了提高我們研究的可信度和可行度,我們使用的都是來自專業癌症數據庫的表型樣本和存活信息,這些都是經過業界認證的可靠數據。”

在數據庫建設方面,怎樣體現專業科學的同時又讓用戶易用易懂?這花費了他們大量的時間。他們更迭了多個版本,從配色、排版和內容的填充都經過多次討論,目的就是給其他科研人員提供一個直觀的數據庫,盡最大努力呈現一個專業數據庫應有的特徵。

他們的遺傳研究方法不僅可以用於癌症還可以擴展到其他的疾病。同時,還可以擴展到對動物和植物的研究。近期,他們通過廣泛收集動物的基因組測序數據並進行處理,構建了13個物種的基因組參考面板,打造了一個用於動物遺傳數據填補的數據庫。這個數據庫可以廣泛應用到動物遺傳育種及品質改良等研究中。數據庫中的數據及提供的工具可以極大地節省研究的成本和時間,大大提高科研效率。

龔靜說,後期他們將繼續維護並持續更新這些數據庫,希望能讓更多研究者受益。另外,他們也考慮根據已開發的數據庫和已鑒定的有潛在功能的遺傳位點,將他們的研究進一步深化。

具體來說,就是將生物信息方法得到的結果與人群分子流行病學、分子生物學相結合,深入挖掘遺傳位點的功能,希望通過多維度的分析尋找並鑒定某種癌症相關的生物標誌物或者藥物靶標,真正實現產學研結合,推動臨床生物醫學實踐,以此造福大眾。

獲得更多的PTT最新消息
按讚加入粉絲團