Hi-C技術(shù)源于染色體構(gòu)象捕獲技術(shù),利用高通量測序技術(shù),結(jié)合生物信息分析方法,研究全基因組范圍內(nèi)整個染色質(zhì)DNA在空間位置上的關(guān)系,獲得高分辨率的染色質(zhì)三維結(jié)構(gòu)信息?;贖i-C數(shù)據(jù)中染色質(zhì)片段間的交互強(qiáng)度呈現(xiàn)出隨距離衰減的規(guī)律,Hi-C可以用于基因組組裝,將雜亂的基因序列組裝到染色體水平。
覆蓋度
不受標(biāo)記數(shù)量限制,有更高覆蓋度和特異性。
實(shí)驗(yàn)操作
無需構(gòu)建作圖群體,周期短實(shí)驗(yàn)規(guī)模小,經(jīng)濟(jì)實(shí)惠。
準(zhǔn)確度
結(jié)果準(zhǔn)確、直觀,受重復(fù)、雜合區(qū)域影響小。
適用范圍
不僅能應(yīng)用于簡單基因組,而且非常適合高雜合類,超大基因組物種輔助組裝。
已有基因組組裝水平提升
基因組de novo輔助組裝
毛酸漿高質(zhì)量參考基因組組裝及其進(jìn)化研究
The Physalis floridana genome provides insights into the biochemical and morphological evolution of Physalis fruits
期刊:Horticulture Research 合作方式:共同作者 影響因子:6.793 發(fā)表時間:2021.11
合作單位:中國科學(xué)院植物研究所 研究對象:毛酸漿
茄科是提供營養(yǎng)和果蔬多樣性的重要來源之一。酸漿屬作為茄科最大的屬之一,具有獨(dú)特的果實(shí)形態(tài)和生化多樣性,是生態(tài)、進(jìn)化和發(fā)育研究的新的園藝作物。毛酸漿作為酸漿屬模式生物的代表物種之一,其花萼在受精后隨漿果發(fā)育迅速膨大,形成“中國燈籠”或膨大花萼綜合征(ICS)這一創(chuàng)新形態(tài),包裹漿果。然而,酸漿屬果實(shí)形態(tài)、生化特性及其起源背后的遺傳基礎(chǔ)還不夠清楚。為了更好地了解茄科此類性狀的起源、進(jìn)化和發(fā)育機(jī)制,研究者使用PacBio三代測序技術(shù)和基于染色體構(gòu)象捕獲的Hi-C技術(shù),實(shí)現(xiàn)了毛酸漿染色體水平的基因組組裝。
材料選擇:二倍體的毛酸漿幼葉
測序策略:
三代平臺 基因組測序,90X
二代平臺 DNA小片段文庫,PE150雙端測序,100X
二代平臺 Hi-C文庫
結(jié)合進(jìn)化和功能分析,對酸漿屬果實(shí)形態(tài)創(chuàng)新“中國燈籠”和特征性化學(xué)成分的進(jìn)化遺傳基礎(chǔ)有了新的認(rèn)識。
高水平的毛酸漿基因組組裝
首先,對基因組進(jìn)行二代測序,共得到149 Gb的高質(zhì)量數(shù)據(jù)。研究發(fā)現(xiàn)基因組純合度較高,并且有大量的重復(fù)序列。通過K-mer分析后,利用三代平臺進(jìn)行測序,得到125 Gb的subreads,組裝成922條contigs,contig N50長度為4.87 Mb。并利用Hi-C數(shù)據(jù)將1.37 Gb的數(shù)據(jù)組裝為12條染色體,使用二代測序數(shù)據(jù)驗(yàn)證,并與全長轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行比對,來評估組裝的完整性,基因組組裝評估表明得到了高水平的毛酸漿染色體水平基因組。

圖1 毛酸漿的形態(tài)和基因組組裝結(jié)果
基因組注釋和基因預(yù)測
利用蛋白質(zhì)編碼基因、tRNA和rRNA基因、轉(zhuǎn)座因子及GC分布和基因組重排事件等信息,進(jìn)行數(shù)據(jù)評估。結(jié)合de novo和同源性的方法,將數(shù)據(jù)整合到毛酸漿基因組中,并在轉(zhuǎn)錄組序列輔助下,注釋蛋白質(zhì)編碼序列。在當(dāng)前基因組版本中,共預(yù)測出32,075個完整蛋白編碼基因,進(jìn)一步預(yù)測了3,655個rRNA,997個tRNA,375個miRNA,和3,047個snRNA 。

圖2 高質(zhì)量的毛酸漿基因組
基因組進(jìn)化分析
利用7,553個單拷貝基因家族進(jìn)行系統(tǒng)基因組分析,揭示了毛酸漿和其他12個代表性物種的拓?fù)浣Y(jié)構(gòu)??紤]到茄科植物共同的WGD歷史,進(jìn)一步研究了酸漿屬、番茄屬和辣椒屬三種基因組。在全染色體水平上,三個基因組之間存在明顯的一對一共線關(guān)系,雖然基因組大小不同,但總體基因組是相對保守的,僅觀察到幾個小規(guī)模的染色體重排和物種特定的基因組區(qū)域。

圖3 茄屬植物的基因組進(jìn)化
基因家族的進(jìn)化分析
選取八種茄科植物的基因組,OrthoMCL法構(gòu)建正交群,發(fā)現(xiàn)在茄科基因組中,大部分基因聚集在直系同源基因或旁系同源基因中;且某些基因家族在進(jìn)化過程中經(jīng)常發(fā)生擴(kuò)張和收縮。在進(jìn)一步揭示基因組獨(dú)特性的研究中,選用毛酸漿和其他12種植物,發(fā)現(xiàn)直系同源基因、旁系同源基因和非聚類基因在13種植物中以相似的方式分布。GO富集分析中,毛酸漿特異的基因則發(fā)揮了多種作用。在以上多層次的進(jìn)化分析中,在酸漿屬、辣椒屬和茄屬植物的基因組中觀察到小規(guī)模突變。其中,與甾體相關(guān)化合物生物合成途徑關(guān)鍵步驟相關(guān)的基因和與“中國燈籠”形成相關(guān)的MADS-box基因的潛在遺傳變異是關(guān)注的重點(diǎn),并做了進(jìn)一步研究。

圖4 被子植物代表性物種的基因家族比較
參與類固醇化合物生物合成途徑的基因進(jìn)化
類固醇是所有真核生物必需物質(zhì)之一,檢測了類固醇在生物合成途徑的關(guān)鍵基因。在33個基因家族中的結(jié)果研究表明,大多數(shù)基因家族的拷貝數(shù)變異(CNV)具有可比性,注釋的HMGR和SQE基因的拷貝數(shù)發(fā)生顯著變化,毛酸漿中發(fā)現(xiàn)20個SQE-like基因(拷貝數(shù)比非毛酸漿基因組高出約4倍),因此表現(xiàn)出特異性擴(kuò)張。在甾體生物合成途徑中,SQE基因編碼黃酮類單加氧酶,在類固醇生物合成途徑中起限速酶的作用。這些基因的CNV在與毛酸漿相關(guān)的不同物種間類固醇代謝產(chǎn)物的自然變異中所起的作用需要進(jìn)一步深入研究。

圖5 毛酸漿中參與類固醇相關(guān)衍生物合成基因的特異性進(jìn)化
毛酸漿“中國燈籠”發(fā)育可能與 MBP21的缺失有關(guān)
毛酸漿基因組包含136個推定的MADS-box基因。研究者對MADS-box基因的進(jìn)化關(guān)系進(jìn)行了研究。排除基因組錯誤組裝的可能性,數(shù)據(jù)同源性搜索結(jié)果證實(shí)毛酸漿和辣椒中MBP21發(fā)生缺失。這種缺失可能是進(jìn)化過程中的染色體重排造成的。MBP21類基因的敲除或突變,往往產(chǎn)生花萼增大的現(xiàn)象。因此,這一基因丟失很可能與“中國燈籠”的起源有關(guān)。MPF2和MBP21基因的共同表達(dá)影響了酸漿屬雄性不育和花萼的生長,表明酸漿屬中MPF2和MBP21間的功能性沖突。這種功能沖突意味著這兩個基因之間的協(xié)調(diào)是它們在ICS發(fā)育中正常發(fā)揮功能所必需的。


圖6 酸漿屬M(fèi)BP21-like MADS-box基因丟失和“中國燈籠”的形成
茄科MBP21丟失與ICS出現(xiàn)的關(guān)系
不同物種基因組的Southern印跡分析結(jié)果表明,酸漿族中MBP21同源基因的丟失與ICS出現(xiàn)有密切關(guān)系。綜上所述,MBP21類基因的丟失可能代表了一種與“中國燈籠”起源有關(guān)的新突變。

圖7 酸漿族MBP21丟失與ICS的發(fā)生相關(guān)
研究者構(gòu)建出第一個毛酸漿的高質(zhì)量染色體水平的參考基因組。除了已知的MPF2的異位表達(dá),基于基因組數(shù)據(jù)還發(fā)現(xiàn)一個SEP類MADS-box基因的丟失這一突變。它們可能共同決定了ICS(膨大花萼綜合征)這一創(chuàng)新形態(tài)的起源。酸漿果實(shí)中某些甾類化合物大量積累可能與SQE基因起源和顯著擴(kuò)展有關(guān)。這些甾體的自然變異可能是基因家族的拷貝導(dǎo)致的。本研究強(qiáng)調(diào)了基因獲得和基因缺失在果實(shí)新性狀進(jìn)化和發(fā)育中的重要作用,毛酸漿基因組數(shù)據(jù)為研究植物進(jìn)化遺傳學(xué)以及其他茄科作物的遺傳改良和育種提供了重要參考。
Lu J, Luo M, Wang L, et al. The Physalis floridana genome provides insights into the biochemical and morphological evolution of Physalis fruits[J]. Horticulture Research, 2021, 8(1):244.