De novo測序即在不依賴參考基因組的情況下對某物種基因組進行從頭測序、拼接和組裝,從而獲得全基因組單堿基精度序列圖譜。全基因組序列圖譜完成后,可以構(gòu)建該物種的基因組數(shù)據(jù)庫;為該物種的后基因組學(xué)研究搭建平臺;為后續(xù)的基因挖掘、功能驗證提供DNA序列信息。
多種測序平臺
“私人訂制”多平臺&多技術(shù)研究測序策略
測序平臺
三代測序儀,周產(chǎn)出HiFi數(shù)據(jù)量3.2T,建庫+測序僅需7天可以完成數(shù)據(jù)交付
專業(yè)的分析團隊
團隊成員合作發(fā)表多篇文章,生物信息分析經(jīng)驗豐富,助力CNS文章發(fā)表
有效的項目管理
前期方案演寫,定期反饋項目進展,客戶與生信分析“零距離”溝通
前沿市場動態(tài)把握
前沿研究信息傳送,組裝技術(shù)研發(fā)與更新,更多產(chǎn)品服務(wù)升級
豐富的項目經(jīng)驗
構(gòu)建參考基因組
復(fù)雜性狀控制基因挖掘
比較基因組
泛基因組
產(chǎn)品類型 | 送樣要求 |
基因組survey(二代平臺) | 樣品類型:基因組DNA樣品 樣品需求量:小片段文庫≥0.2 μg 樣品濃度:≥5 ng/μl 樣品純度:OD260/280=1.8-2.2、OD260/230=0.8-2.5 樣品質(zhì)量:基因組完整,DNA主帶清晰、無降解、無污染 |
基因組de novo(三代平臺) | DNA總量:HiFi≥6 μg 濃度:≥30 ng/μl 質(zhì)量:基因組完整性,DNA主帶:HiFi≥30 Kb 純度:OD260/280≥1.5、 OD260/230≥1.2、 QC/NC=0.5-2.0 |
基因組注釋 | 至少6個不同時期或不同部位的樣品,推薦kinnex Iso-seq 3M/GS 數(shù)據(jù)量 |
Hi-C輔助組裝(二代平臺) | 新鮮組織進行甲醛交聯(lián),1個Hi-C文庫至少需要新鮮血液約5 ml或組織1 g,推薦2-3 g組織量 |
注:若提供組織樣品,則植物樣本需為無菌黃化苗、組培樣品或嫩葉;動物樣本為肌肉、血液等脂肪含量較少的組織。盡量選擇同一個體取樣,以減少個體差異性對后續(xù)拼接的影響。如果動物樣本的性別決定模式是XY型,則盡量選擇雌性個體(XX型),如果是ZW型,則盡量選擇雄性個體(ZZ型)。
多組學(xué)技術(shù)助力油松基因組適應(yīng)繁殖機制和進化解析
The Chinese pine genome and methylome unveil key features of conifer evolution
期刊:Cell 合作方式:共同作者 影響因子:41.582 發(fā)表時間:2022.01 合作單位:北京林業(yè)大學(xué)研究 對象:35年生無性系優(yōu)良油松的新芽
針葉樹在世界森林生態(tài)系統(tǒng)中占主導(dǎo)地位,是種植最廣泛的樹種之一。針葉樹基因組屬于大型基因組,存在高度重復(fù)序列(70%-80%),因此基因組組裝難度較高。
研究者利用三代測序、Hi-C輔助組裝等技術(shù),組裝獲得了25.4 Gb染色體水平的油松基因組。通過使用來自760個生物樣本的大規(guī)模RNA-seq數(shù)據(jù)來輔助基因結(jié)構(gòu)注釋,揭示油松基因組擴展、生殖過程和適應(yīng)性進化的多重基因組特征和分子機制。
測序策略:
DNA:DNA小片段文庫,103X;三代基因組測序,103X;二代測序,Hi-C文庫
RNA:二代測序,構(gòu)建RNA文庫
油松基因組研究給針葉樹進化研究提供了新思路,為今后進一步開展針葉樹適應(yīng)與發(fā)育研究提供了數(shù)據(jù)參考。
油松染色體基因組組裝和注釋
研究者首先通過二代測序,對油松基因組大小進行評估,隨后利用三代測序數(shù)據(jù)進行自校正和組裝,成功構(gòu)建出24.4 Gb(96.1%,12條染色體)的油松高質(zhì)量的染色體水平基因組。
針葉樹中的基因通常多于二倍體被子植物,基因復(fù)制導(dǎo)致了許多基因家族的擴張。在基因復(fù)制的不同類別中,油松的旁系同源主要來源于分散重復(fù)(DSD),很少來自全基因組復(fù)制(WGD),油松發(fā)生近期全基因組復(fù)制事件概率較低。

圖1 油松高質(zhì)量基因組組裝
長內(nèi)含子的獨特基因空間結(jié)構(gòu)
油松的基因組存在大量的長內(nèi)含子,總內(nèi)含子/外顯子長度與基因組的大小呈正相關(guān),基因表達(dá)水平的差異與基因長度和內(nèi)含子數(shù)有關(guān)。長基因的RNA剪接和DNA甲基化檢測結(jié)果表明,幾乎所有CG和CHG位點都發(fā)生了甲基化,DNA甲基化可能參與了長內(nèi)含子的準(zhǔn)確識別。

圖2 油松基因組的基因空間結(jié)構(gòu)和復(fù)雜性展示
油松的適應(yīng)進化
通過功能富集分析發(fā)現(xiàn)了3,623個顯著擴張的家族基因,主要參與生物和非生物脅迫反應(yīng)。通過鑒定油松中的轉(zhuǎn)錄因子(TF)和轉(zhuǎn)錄調(diào)節(jié)因子(TR)家族,發(fā)現(xiàn)對低溫高度敏感的AP2/ERF基因家族成員可能在油松的低溫適應(yīng)中發(fā)揮關(guān)鍵作用。在候選基因編碼酶鑒定中,萜烯合成相關(guān)基因在不同年齡的油松中有明顯的表達(dá)模式,新形成的針葉可能是萜烯的主要合成部位。

圖3 油松中萜烯的合成途徑
針葉樹生殖發(fā)育的獨特調(diào)控網(wǎng)絡(luò)
被子植物中具有很多調(diào)節(jié)開花的關(guān)鍵基因,但油松中缺少很多同源基因。FT/TFL1-like基因是被子植物中調(diào)節(jié)開花的關(guān)鍵基因,但油松中僅有2個拷貝,但在其他針葉樹中一般有4-6個拷貝。研究者在擬南芥中做了轉(zhuǎn)基因驗證, 過表達(dá)了這兩個基因,轉(zhuǎn)基因植株表現(xiàn)出明顯的晚開花表型。
通過對油松基因組中12個高表達(dá)的MADS-box基因的酵母雙雜交檢測,發(fā)現(xiàn)兩個AGL6-like基因(PtDAL1和PtDAL14)在油松中有不同的表達(dá)模式,其中PtDAL14在生殖器官中特異性表達(dá),與其他MADS-box轉(zhuǎn)錄因子蛋白相互作用,表明AGL6-like基因可能作為MADS-box轉(zhuǎn)錄因子之間相互作用的橋梁,從而形成互作網(wǎng)絡(luò)。最后研究者提出了一個控制油松雌雄球果發(fā)育的模型,為今后針葉樹生殖發(fā)育研究提供了一張藍(lán)圖。

圖4 油松中12個MADS-box家族轉(zhuǎn)錄因子的表達(dá)及蛋白互作模型
油松近期的LTR-RT的爆發(fā)和穩(wěn)定的甲基化維持系統(tǒng)
從染色體層面看,基因組甲基化水平與油松的TE覆蓋率顯著相關(guān),研究發(fā)現(xiàn)攜帶TE的基因區(qū)域的平均甲基化水平遠(yuǎn)高于不攜帶TE的基因區(qū)域,但TSS和TES區(qū)域的平均甲基化水平始終較低。DNA甲基化對于TE基因組的擴張產(chǎn)生了影響,但未有證據(jù)表明,油松甲基化程度隨樹齡的增加而下降。LTR-RTs代表了大部分TEs,不平等重組(UR)是植物中一種重要的LTR-RT清除機制,針葉樹的UR率可能比被子植物小型基因組低得多,SGS3-RDR6-RdDM通路可能是針葉樹中主要的DNA甲基化途徑。

圖5 油松中DNA甲基化及轉(zhuǎn)座子擴張
研究者構(gòu)建了當(dāng)前大型基因組中連續(xù)性最好的高質(zhì)量染色體水平的油松基因組。研究發(fā)現(xiàn)轉(zhuǎn)座子的不斷擴張和緩慢清除是導(dǎo)致針葉樹基因組巨大的重要原因,具有超長內(nèi)含子的大基因往往表達(dá)水平較高。與被子植物相比,油松具有獨特的生殖系統(tǒng)。油松基因組的構(gòu)建為其獨特適應(yīng)性和發(fā)育研究、生殖生物學(xué)研究及基因組輔助育種進化和基因組學(xué)研究提供了重要參考。
Niu S.H., Li J., Bo W.H., et al.The Chinese pine genome and methylome unveil key features of conifer evolution. Cell, 2022, 185(1):1-14.