每日最新頭條.有趣資訊

黑木耳之真菌基因組測序研究

在烈日炎炎的夏天,小編最近遨遊在微生物各種pubmed的海洋裡,懸浮在各種有著強大功能的細菌古菌真菌的世界裡,他們看似「呆萌」,但一個個都身懷絕技、神通廣大,似乎有著某種超能力,吸引著小編渴求真知的眼球,跋山涉水的小腿已經按捺不住啦,快跟隨著小編的腳步去探索他們的神奇奧秘吧......


英文題目:Whole genome sequence of Auricularia heimuer (Basidiomycota, Fungi), the third most important cultivated mushroom worldwide

發表雜誌:Genomics


黑木耳(Auricularia heimuer)是中國最著名的傳統食品和藥品之一,也是全球第三大栽培蘑菇。味道美好且具有抗腫瘤、降低膽固醇、抗凝血、抗氧化、免疫調節、抗炎和抗菌活性等相關健康特性。其藥用價值的最早報導記錄在明代李世珍著名的中藥專著《本草綱目》中。黑木耳是木材腐爛真菌的一個非常重要的屬,在中國和其他一些亞洲國家,有幾種植物被廣泛種植為食用和藥用蘑菇。


近年來真菌基因組的實用性大大增加,促進了基因多樣性的研究,同時通過基因組數據的挖掘,鑒定了參與次生代謝物生物合成的關鍵基因。在本研究中,測序出A.heimuer Dai13782的基因組序列,並鑒定了可能參與生物活性蛋白質和多糖生物合成的推定基因。其目的是為了開發A.heimuer基因組資源,從而研究其次級代謝產物、木材降解及多糖生物合成能力。本研究是A.heimuer的第一個基因組規模組裝和注釋,也是黑木耳中的第三個測序物種。

材料與方法

通過使用Illumina HiSeq 4000和PacBio RSII測序平台,獲得菌株Dai 13782的單孢子菌絲體的基因組。通過用不同的公共資料庫對蛋白質序列進行功能注釋。該基因組大小為49.7 Mb,N50支架大小為1,350,668 bp,編碼16,244個預測基因。

結果與討論

1、數據的排序和組裝

Auricularia heimuer產生HiSeq數據6614 Mb、PacBio數據2835 Mb。數據見表1和表2。

2、基因組功能注釋

Auricularia heimuer的基因注釋統計的詳細資訊如表3所示。目前,NCBI WGS資料庫中有三種黑木耳屬(Auricularia subglabra,Auricularia auricula-judae和Exidia glandulosa)的基因組。將A.heimuer的組裝統計數據與表4中的其他三種物種進行比較,其結果具有相似的GC含量,但與A.subglabra和E.glandulosa基因組大小卻顯著不同。使用單片直系同源物測試的結果進行基因組組裝和注釋,其結果具有完整的注釋集。其中92.4%的真菌BUSCO存在於RefSeq注釋集中,5.5%的真菌BUSCO片段化。BUSCO分析的詳細情況見表5。


3、重複序列

重複序列的總長度為3,429,083 bp,佔基因組長度的6.89%。在重複元件中,串聯重複序列佔2.32%,轉座因子(TE)佔組裝基因組的約4.57%。在TE中,長末端重複序列(LTR)和非LTR轉座子的比例分別是基因組的2.96%和0.99%。


4、基因注釋

使用公開可用的資料庫支持16,244種蛋白質編碼基因的注釋。所有蛋白質編碼基因共具有28,840,601 bp的總序列長度,包括22,015,521 bp的外顯子區域和6,825,080 bp的內含子區域。蛋白質編碼區佔基因組的44.24%。平均每個預測基因含有5.36個外顯子。基因通常包含小外顯子(平均252.67 bp)和內含子(平均98.18 bp),這與其他擔子菌相似。


對於RNA,預測了150個tRNA,34個snRNA和11個rRNA。基因密度為5.63個基因/10kb,以及蛋白質編碼的平均大小基因為1355.30 bp。在tRNA中,12種是可能的假基因,剩餘的138種反密碼子tRNA對應於20種常見的氨基酸密碼子。此外,79個tRNA缺乏內含子序列。


在A.heimuer基因組中發現了總共1109個編碼假設蛋白質的預測基因,這些蛋白質與目前可用的序列沒有明顯的同源物。 Nr,GO,COG,KEGG,CAZy,SwissProt,PHI,InterPro和TrEMBL資料庫的注釋顯示,這些同源蛋白質基因代表組裝基因組的93.17%。


通過COG作圖,將1801種蛋白質(11.08%)分配到COG類別(圖2)。 「僅一般功能預測」具有最高數量的基因(408);這些蛋白質沒有明確地分配給特定的組。其次是「翻譯、核糖體結構及系統進化」,「翻譯後修飾、蛋白質周轉及分子伴侶」,「轉錄」,「複製、重組及修復」,「能量產生和轉化」,作為COG資料庫中最豐富的類別。這些發現提示存在豐富多樣的蛋白質代謝和能量代謝功能,能夠更好地吸收和轉化來自底物的營養物質。


Fig. 2. The Clusters of Orthologous Groups of proteins (COG) function classification of proteins in Auricularia heimuer


根據GO資料庫,7056個預測蛋白質佔整個基因組的43.43%,主要分布在五個功能上條目,「結合」,「催化活性」,「細胞過程」,「代謝過程」和「單一生物過程」(圖3)。

Fig. 3. The Gene Ontology (GO) function annotation of Auricularia heimuer

為了進一步了解A.heimuer中的基因功能,我們成功在KEGG資料庫中將5676(34.94%)推定的蛋白質分配給它們的直系同源物。 KEGG功能分類如圖4所示。與COG注釋類似,KEGG中的一些代謝和生物合成類別高度豐富。

Fig. 4. The Kyoto Encyclopedia of Genes and Genomes (KEGG) function annotation of Auricularia heimuer.


5、CAZyme

用CAZy繪製了真菌基因組,從而研究CAZymes的存在。總共336個基因可以分配給碳水化合物活性酶(CAZymes)家族(表6)。GH的數量明顯大於GT,這可能是由於生活方式的原因,其生存依賴於木質纖維素的分解。結論是多糖的分解比它們對A.heimuer的生長和代謝的構建更重要。A.heimuer中的CBM數量多於平均值,而CE,GT,GH和PLs低於擔子菌平均值。



6、CYP家族值

A.heimuer有72個基因分布在「細胞色素P450的異生素代謝」和60個「藥物代謝-細胞色素P450」KEGG亞途徑中。A.heimuer共有83個CYP基因,根據Nelson的命名法可分為21個家族(表7)。發現CYP64家族具有最高數量的基因(26個基因),其次是CYP2(10個基因)和CYP4(9個基因)家族(表5)。CYP64家族參與「其他次級代謝產物的生物合成」,而來自CYP73,CYP76和CYP97家族的基因在「萜類化合物和聚酮化合物的代謝」中是必需的。CYP2和CYP4家族在「脂質代謝」中起作用。然而,這些預測的CYP基因仍需要在進一步的研究中得到驗證。



7、次級代謝

對於現代藥理學和治療學領域,由於其多樣且顯著的次級代謝產物已經在藥用真菌中產生了影響,已證明其具有藥理學性質,例如免疫調節,抗炎,抗病毒,抗氧化,抗腫瘤和抗微生物活性。


次級代謝產物的生物合成基因通常是連續的基因簇。我們通過基因組挖掘搜索可能參與次生代謝物生物合成的基因,如萜烯合酶(TS),非核糖體肽合成酶(NRPS)和聚酮化合物合酶(PKS)的基因。在A.heimuer基因組中鑒定了一個NRPS基因簇。


用blastp將潛在的PKS基因與Genebank比對,並且手動檢查它們的功能資訊。結果表明A.heimuer沒有PKS基因。造成這種現象的原因還需要進一步研究。 A.heimuer的NPRS基因簇的一個譜系可能負責細胞內鐵載體生物合成,其編碼鐵載體合成酶的單拷貝基因(Dai13782_GLEAN_10006893)。鐵載體在真菌細胞中發揮關鍵作用,其在性孢子發育中起主要作用或無性發育。所有已知的真菌鐵載體均由NRPS合成。


在真菌中,已經鑒定的最大的生物活性天然產物組之一是萜類化合物,其衍生自簡單的五碳前體分子二甲基烯丙基二磷酸酯(DMAPP)和通過甲羥戊酸途徑從乙醯-CoA產生的異戊烯二磷酸酯(IPP)。編碼TS的基因簇有5個,是萜烯生物合成的關鍵酶。我們檢查了「Terpenoid骨架生物合成(map00900)」途徑中的A.heimuer基因,並鑒定了分布在MVA途徑中的15種關鍵酶(圖5)。表8總結了MVA途徑中涉及的所有核心酶。酶蛋白-S-異戊二烯半胱氨酸O-甲基轉移酶,二磷酸甲羥戊酸脫羧酶,其分別由兩個基因拷貝編碼,而其餘12個酶的編碼通過單一副本基因。

Fig. 5. 「Terpenoid backbone biosynthesis」 pathway of Auricularia heimuer.

在A.heimuer基因組中搜索潛在的三萜類生物合成基因產生ORF(Dai13782_GLEAN_10010970),其編碼羊毛甾醇合成酶(LSS)的單拷貝基因(ERG7;K01852;EC5.4.99.7)。


LSS是一種氧化角鯊烯環化酶家族酶,催化三萜烯角鯊烯或2-3-氧化角鯊烯環化成質子醇陽離子,最後催化所有類固醇的前體羊毛甾醇。羊毛甾醇是膽固醇生物合成的關鍵四環中間體。預計P450基因的CYP73,CYP76和CYP97家族參與「萜類化合物和聚酮化合物的代謝」。


8、A. heimuer中多糖的生物合成

黑木耳中富含生物活性物質-多糖,多糖具有活躍的免疫調節和抗腫瘤的作用,因此可知黑木耳具有一定的藥物潛質。同時,研究表明有33種酶可能參與A.heimuer中尿苷二磷酸葡萄糖(UDP-葡萄糖,葡聚糖前體)的生物合成,這些酶包括1,3-β-葡聚糖合成酶,己糖激酶,磷酸葡糖苷酶,GTP酶活化蛋白和UTP-葡萄糖-1-磷酸尿苷醯轉移酶。

結論

A.heimuer基因組使我們能夠預測基因的功能並研究活性化合物的生物合成。對A.heimuer基因組中次級代謝物生物合成基因的研究表明,其特別富含萜烯生物合成基因。因此,未來對生物活性分子的研究可以集中在這類代謝物中。雖然該研究還不太完善,但本研究A.heimuer基因組的測序完成為研究未來藥理活性化合物和功能性食品應用的生物合成提供了基礎資訊。


參考文獻:

Yuan Y, Wu F, Si J, et al. Whole genome sequence of Auricularia heimuer (Basidiomycota, Fungi), the third most important cultivated mushroom worldwide.[J]. Genomics, 2017.


獲得更多的PTT最新消息
按讚加入粉絲團