單體型基因組組裝技術(shù)區(qū)別于傳統(tǒng)嵌合基因組,其可以獲得單獨(dú)來(lái)自父本或母本、能同時(shí)遺傳給下一代的一組序列信息。染色體水平的單體型基因組可以實(shí)現(xiàn)等位基因或同源染色體的組裝。
“私人訂制”服務(wù)
針對(duì)客戶物種和材料準(zhǔn)備情況,有針對(duì)性地定制測(cè)序和組裝策略,定期反饋?lái)?xiàng)目進(jìn)展。
自主研發(fā)的分析流程
自主研發(fā)的分型流程,實(shí)現(xiàn)較高的準(zhǔn)確度,較長(zhǎng)的Block N50,較快的分型速度。
多種組裝策略
可以實(shí)現(xiàn)有親本二倍體、無(wú)親本二倍體、異源/同源四倍體的有效分型。
經(jīng)驗(yàn)豐富的分析團(tuán)隊(duì)
單體型基因組組裝揭示茶樹的演化史
Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant Camellia sinensis
期刊:Nature Genetics 合作方式:提供服務(wù) 影響因子:38.330
發(fā)表時(shí)間:2021.07 合作單位:福建農(nóng)林大學(xué)、中國(guó)農(nóng)業(yè)科學(xué)院(深圳)農(nóng)業(yè)基因組研究所 研究對(duì)象:茶樹
茶葉作為一種全球性的經(jīng)濟(jì)作物,有很強(qiáng)的保健作用。茶樹是無(wú)性繁殖的,這種方式可以有效地維持因有性重組而分離或丟失的有價(jià)值的基因型。然而,這種繁殖方式也會(huì)積累大量有害突變,導(dǎo)致“穆勒棘輪”效應(yīng),致使作物遭受損失。茶樹是二倍體,含有15對(duì)同源染色體,嵌合式的基因組組裝(篩選同源染色體中的一份拷貝作為代表組裝到染色體水平)可能會(huì)錯(cuò)過(guò)重要選擇性狀的等位變異,而分型組裝(不同親本的兩套同源染色體同時(shí)組裝到染色體水平)能更完整地呈現(xiàn)二倍體基因組的全部遺傳信息。
材料選擇:山茶植株芽、根、莖、花、幼葉和成熟葉
測(cè)序策略:
DNA:
三代平臺(tái)基因組測(cè)序 114X
二代平臺(tái) 150 bp雙端測(cè)序,DNA小片段文庫(kù)
二代平臺(tái) Hi-C文庫(kù) 99.4X
RNA:
三代平臺(tái),Iso-seq文庫(kù)
中國(guó)烏龍茶品種鐵觀音及幾個(gè)主要的茶樹品種和近緣物種進(jìn)行測(cè)序及單體型組裝,探索地理上不同的茶樹群體之間的遺傳多樣性,為深入了解茶樹的馴化史和進(jìn)化史提供依據(jù)。
基因組組裝與注釋
鐵觀音的基因組大小約為3.15 Gb,雜合度為2.31%。利用PacBio長(zhǎng)讀長(zhǎng)對(duì)原始數(shù)據(jù)進(jìn)行組裝得到初始contig,大小為5.41 Gb。將Khaper算法過(guò)濾產(chǎn)生的單倍體組裝結(jié)果掛載到15個(gè)染色體(圖1),得到單倍體參考基因組(monoploid reference genome),大小為3.03 Gb。同時(shí)利用ALLHiC算法得到鐵觀音單體型基因組(haplotype-resolved genome),大小為5.98 Gb。共線性分析顯示它們的基因順序高度一致。

圖1 鐵觀音基因組組裝和質(zhì)量評(píng)估
等位基因特異性表達(dá)
利用鐵觀音不同組織的全基因組測(cè)序,分離得到14,691個(gè)等位基因(圖2),其中1,528個(gè)基因存在一致性的等位特異性表達(dá)(consistent allele-specific expression, ASEGs),即一個(gè)等位基因在所有組織和樣本中的表達(dá)都高于另一等位基因?;蚋患治鲲@示這些基因參與核糖體等多個(gè)生物學(xué)基本過(guò)程,與克服有害突變的潛在機(jī)制相關(guān)。同時(shí)還發(fā)現(xiàn)了386個(gè)非一致的ASEGs,它們?cè)诓煌M織的等位基因之間存在特異性表達(dá)。其中幾個(gè)基因與揮發(fā)性有機(jī)化合物的生物合成有關(guān),包括黃酮和黃酮醇等的生物合成途徑,這與植物的適應(yīng)性演化相關(guān)。結(jié)果表明,在鐵觀音基因組中,一致性的ASEG明顯多于不一致的ASEG(1,528
vs 386),這一趨勢(shì)與雜交水稻的結(jié)果正好相反,即在雜交水稻中,不一致的ASEG遠(yuǎn)遠(yuǎn)大于一致性的ASEG。這種現(xiàn)象或許可以用雜種優(yōu)勢(shì)理論中的顯性效應(yīng)解釋,長(zhǎng)期無(wú)性繁殖的茶樹利用優(yōu)勢(shì)等位基因應(yīng)答不斷積累的遺傳負(fù)荷,以保持個(gè)體的適應(yīng)度。

圖2 茶樹單倍型基因組等位不平衡
茶樹遺傳變異和群體結(jié)構(gòu)分析
通過(guò)對(duì)161份茶樹種質(zhì)資源重測(cè)序數(shù)據(jù)分析,發(fā)現(xiàn)樣本主要分為三類(圖3),分別為大理茶,大葉茶和小葉茶,與茶樹的形態(tài)學(xué)分類一致。另外大葉茶可以分類古大葉茶和栽培大葉茶;而小葉茶依據(jù)地理分布可分為四個(gè)亞組,分別為SSJ(陜西,四川,江西),ZJNFJ(浙江和福建北部),SFJ(福建南部),HHA(湖北,湖南和安徽)。TreeMix分析發(fā)現(xiàn)這些茶樹之間存在顯著的基因流動(dòng),表明種內(nèi)基因交流頻繁,其中一些與有記錄的茶樹雜交育種歷史相吻合。

圖3 茶樹群體系統(tǒng)進(jìn)化與群體結(jié)構(gòu)分析
大葉茶和小葉茶的進(jìn)化史和馴化史
對(duì)14種山茶屬植物的21株單株進(jìn)行了全基因組測(cè)序,通過(guò)群體遺傳分析發(fā)現(xiàn)大葉茶和小葉茶具有不同的進(jìn)化史。在Gelasian epoch時(shí)期(259-181萬(wàn)年前),劇烈的氣候變化很可能導(dǎo)致了整個(gè)茶樹物種(包括大葉茶和小葉茶)的群體收縮;兩個(gè)變種分化后,僅小葉茶在Last Glacial Maximum時(shí)期(2.65-1.9萬(wàn)年前)可能由于溫度驟降出現(xiàn)了再一次的群體收縮,但隨后適應(yīng)了環(huán)境的小葉茶迅速擴(kuò)張,群體規(guī)模得到恢復(fù)。該分析表明,大葉茶和小葉茶分化后的進(jìn)化史不同(圖4)。通過(guò)對(duì)大葉茶和小葉茶馴化基因的分析,發(fā)現(xiàn)它們的馴化過(guò)程是并行的(即獨(dú)立馴化),這些馴化基因參與了一系列重要的生物學(xué)過(guò)程且受人工選育的偏好性影響?;贙EGG分析,在大葉茶馴化早期以參與氧化石墨烯苷轉(zhuǎn)運(yùn)、糖苷轉(zhuǎn)運(yùn)通路為主,后期品種改良主要集中在合成生物堿和芳香化合物等。例如,研究人員鑒定到CsXDH基因在大葉茶品種改良階段受到強(qiáng)烈的人工選擇,該基因編碼黃嘌呤脫氫酶,是咖啡因合成通路的重要基因。而小葉茶品種的早期馴化與植物抵御相關(guān),改良過(guò)程主要集中在花發(fā)育的調(diào)控和對(duì)一氧化氮的響應(yīng),已有研究表明,NO的積累可以加速γ-氨基丁酸的消耗從而幫助植物抵御冷脅迫,這表明篩選耐寒的品種也是人工選育的重要目標(biāo)。

圖4 大葉茶和小葉茶的平行馴化
本研究成功組裝了兩套鐵觀音基因組(單倍體參考基因組和單體型基因組)。通過(guò)對(duì)等位基因特異性表達(dá)的分析,預(yù)測(cè)顯性效應(yīng)可能是鐵觀音應(yīng)對(duì)遺傳負(fù)荷的重要機(jī)制。通過(guò)對(duì)茶樹種群水平的遺傳分析,揭示了該物種的進(jìn)化和人工馴化歷史。該成果為利用組學(xué)分析和分子生物學(xué)技術(shù)挖掘功能基因、解析其背后的遺傳調(diào)控機(jī)制,開(kāi)展基于大數(shù)據(jù)驅(qū)動(dòng)的基因組智能設(shè)計(jì)育種奠定了堅(jiān)實(shí)的理論基礎(chǔ),同時(shí)也為縮短育種周期、提高育種效率、降低育種成本提供了科學(xué)依據(jù)。
Zhang X, Chen S, Shi L, et al. Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant Camellia sinensis[J]. Nature Genetics, 2021,53(8):1250-1259