10月24日,南京農(nóng)業(yè)大學(xué)園藝學(xué)院滕年軍教授團(tuán)隊(duì)、薛佳宇副教授團(tuán)隊(duì),華中農(nóng)業(yè)大學(xué)園藝林學(xué)學(xué)院寧國(guó)貴教授團(tuán)隊(duì)與福建農(nóng)林大學(xué)明瑞光教授團(tuán)隊(duì)等國(guó)內(nèi)10多家科研團(tuán)隊(duì)聯(lián)合公布了百合高質(zhì)量染色體級(jí)別基因組,成為世界上首個(gè)正式報(bào)道的最大植物基因組。相關(guān)文章“The evolutionary tale of lilies: Giant genomes derived from transposon insertions and polyploidization”發(fā)表在《The Innovation》期刊。
基因組存儲(chǔ)了一個(gè)物種的完整遺傳信息,是理解其生物學(xué)特性和進(jìn)化歷程的關(guān)鍵。自然界中,不同生物的基因組揭示了生命之樹(shù)上基因組大小的巨大差異,其中一些植物擁有超大的基因組。然而,這些超大基因組的起源和形成機(jī)制卻不盡相同。
百合(Lilium L.)是單子葉百合目百合科多年生植物,因其極高的觀賞、食用與藥用價(jià)值而備受關(guān)注。本研究利用Nanopore、Illumina和Hi-C測(cè)序技術(shù),以及優(yōu)化的組裝方法,獲得了36.68 Gb的蘭州百合(Lilium davidiivar. unicolor)超大型基因組,并解析了其形成機(jī)制和特征,也揭示了鱗莖營(yíng)養(yǎng)物質(zhì)積累的遺傳基礎(chǔ)。這一成果標(biāo)志著百合的分子研究進(jìn)入新時(shí)代,也是植物基因組學(xué)的重要突破性研究進(jìn)展之一。論文的主要研究?jī)?nèi)容具體如下:
超大基因組的染色體水平組裝。流式細(xì)胞實(shí)驗(yàn)和K-mer分析預(yù)估蘭州百合基因組的預(yù)估大小分別為38.01 Gb和37.62 Gb,雜合率為2.18%。細(xì)胞核型分析顯示其為二倍體,具有12對(duì)巨型染色體。結(jié)合Nanopore、Illumina和Hi-C數(shù)據(jù),成功組裝得到36.68 Gb的基因組,Scaffold N50為2.86 Gb,96.99%的序列被掛載到12條染色體上(圖1A)。注釋87,501個(gè)蛋白編碼基因,其中功能注釋比率為89.54%。評(píng)估結(jié)果顯示蘭州百合的基因組的高完整性、準(zhǔn)確性和連續(xù)性。
超大型基因組的形成原因?;蚪M大小的主要影響因素包括重復(fù)序列的積累和基因組多倍化。蘭州百合基因組中,重復(fù)序列占比高達(dá)88.31%,其中長(zhǎng)末端重復(fù)反轉(zhuǎn)錄轉(zhuǎn)座子(LTR-RTs)占64.40%。分析顯示,蘭州百合的LTR-RT在近五百萬(wàn)年以來(lái)發(fā)生急劇擴(kuò)張,其中Copia類(lèi)的擴(kuò)張約一百六十五萬(wàn)年前達(dá)到高峰,Gypsy類(lèi)的擴(kuò)張則在約八十九萬(wàn)年前爆發(fā);在更細(xì)分的亞類(lèi)型層面,Athila、Retand、Tekay和Tork等亞類(lèi)獲得了特異性的快速擴(kuò)張(圖1C),這些亞類(lèi)對(duì)異染色質(zhì)區(qū)域有偏好,抑制重組,降低LTR-RT去除率,從而造成短時(shí)間內(nèi)LTR-RT的海量插入且無(wú)法去除,形成了蘭州百合超大的巨型基因組(圖1B)。
全基因組復(fù)制也是基因組擴(kuò)張的潛在原因。Ks分布圖顯示百合經(jīng)歷了兩輪全基因組復(fù)制事件,與金錢(qián)蒲、蘆筍等植物的共線性分析支持了這一結(jié)論(圖1D)。基于核基因的系統(tǒng)發(fā)育分析,將百合置于天門(mén)冬目的姊妹群,兩者分化于7千2百萬(wàn)年前(圖1E)?;诖讼到y(tǒng)框架,盡管近緣的洋蔥和大蒜都額外多經(jīng)歷了兩輪全基因組復(fù)制,它們的基因組卻不到蘭州百合的一半大,表明百合在進(jìn)化過(guò)程中展現(xiàn)出與它們不同的模式。
超長(zhǎng)基因的形成及其表達(dá)規(guī)律。蘭州百合基因組中的長(zhǎng)基因非常常見(jiàn),其平均長(zhǎng)度為57.61 Kb,而長(zhǎng)度超過(guò)50 Kb的基因(定義為“超長(zhǎng)基因”)占33.88%。然而蘭州百合基因編碼序列的平均長(zhǎng)度僅為847.17 bp,提示我們其長(zhǎng)內(nèi)含子才是形成超長(zhǎng)基因的主要原因。對(duì)基因表達(dá)模式的分析發(fā)現(xiàn),基因長(zhǎng)度與表達(dá)水平顯著相關(guān),但表現(xiàn)出變化的趨勢(shì):短于50 Kb的基因表達(dá)水平隨基因長(zhǎng)度變長(zhǎng)而持續(xù)上升,而長(zhǎng)于50 Kb的基因則表達(dá)持續(xù)下降(圖1F)。我們推測(cè)50 Kb可能是限制基因轉(zhuǎn)錄或內(nèi)含子剪接效率的轉(zhuǎn)折點(diǎn),這種表達(dá)變化尚未在其他物種中見(jiàn)到,可能為百合獨(dú)有的特征。
鱗莖發(fā)育的碳水化合物代謝。鱗莖是百合的重要營(yíng)養(yǎng)儲(chǔ)存器官,東亞地區(qū)被廣泛用作藥物和食品。為闡明其發(fā)育過(guò)程中的營(yíng)養(yǎng)積累及機(jī)制,我們對(duì)不同發(fā)育階段的鱗莖樣本進(jìn)行了多組學(xué)分析。結(jié)果顯示,淀粉和蔗糖在發(fā)育過(guò)程中不斷積累(圖1G),轉(zhuǎn)錄組分析發(fā)現(xiàn)糖酵解代謝途徑中的基因高表達(dá),且具有器官特異性。此外,檢測(cè)到870種代謝物,表明代謝產(chǎn)物多樣性。代謝組與轉(zhuǎn)錄組的相關(guān)性分析顯示碳水化合物代謝物與特定基因表達(dá)模塊顯著關(guān)聯(lián)(圖1H)。
南京農(nóng)業(yè)大學(xué)為該論文的第一署名單位和通訊單位,南京農(nóng)業(yè)大學(xué)鐘山青年研究員徐素娟博士、已畢業(yè)碩士張心祺、吳玉峰教授,華中農(nóng)業(yè)大學(xué)博士生陳潤(rùn)洲以及上海市農(nóng)科院楊柳燕研究員為論文的共同第一作者;南京農(nóng)業(yè)大學(xué)滕年軍教授、薛佳宇副教授,華中農(nóng)業(yè)大學(xué)寧國(guó)貴教授以及福建農(nóng)林大學(xué)明瑞光教授為論文共同通訊作者;北京林業(yè)大學(xué)、海南大學(xué)、云南大學(xué)、揚(yáng)州大學(xué)、山西農(nóng)業(yè)大學(xué)、沈陽(yáng)農(nóng)業(yè)大學(xué)、北京農(nóng)學(xué)院、甘肅農(nóng)業(yè)大學(xué)、甘肅農(nóng)科院、湖南農(nóng)科院、長(zhǎng)江師范學(xué)院、武漢希望組生物科技有限公司、江蘇省棲霞百合科技小院等單位20多位合作者參與了本研究。本研究得到了國(guó)家重點(diǎn)研發(fā)計(jì)劃、江蘇省種業(yè)振興揭榜掛帥項(xiàng)目等資助和南京農(nóng)業(yè)大學(xué)生物信息學(xué)中心高性能計(jì)算平臺(tái)的支持。
文章鏈接:
https://www.sciencedirect.com/science/article/pii/S2666675824001644