有了测序结果如何找同源序列(南荻测序组装难)
南荻
2021年4月28日,中国科学院分子植物科学卓越创新中心韩斌研究组与中科院植物所桑涛研究组长期合作,成功完成了多年生禾本科芒属南荻基因组序列草图的绘制,相关研究成果论文在线发表于国际学术期刊《自然·通讯》上。
南荻是中国特有的一类芒属植物,是一种很有应用价值的木质纤维素生物乙醇原料和生物质材料。南荻的年均干生物质产量要高于芒、荻和五节芒。基因组较大且重复序列含量高,南荻基因组一直被视为较难测序组装的复杂植物基因组。
韩斌研究组利用纳米孔技术和高通量染色体构象捕获技术对中国特有的多年生禾本科芒属物种——南荻基因组进行了测序组装和分析,构建了第一个染色体级别的高质量南荻基因组序列,序列总长为2.07Gb,覆盖了南荻全基因组的96.64%。
南荻基因组特征分析
研究组通过基因鉴定,证实了南荻的异源四倍化起源假说,且进一步将19条染色体分配到了两个亚基因组。南荻基因组注释包含68,328个蛋白编码基因,其中94.75%的基因位于19条染色体上。南荻基因组中重复序列约占基因组的69.27%。
通过南荻与其它禾本科植物的比较基因组分析,研究团队确证了南荻基因组内近期的全基因组加倍事件,同时鉴定到一系列的染色体结构变异,这些染色体结构变异(包括染色体融合事件),加速了南荻在全基因组加倍之后的二倍化进程。
同时,本研究还组装了一个南荻叶绿体基因组序列,通过与公开的芒属植物叶绿体基因组序列的系统发育分析,确定了本研究的基因组测序材料与已发表的南荻叶绿体基因组具有最近的亲缘关系,基于叶绿体基因组序列的系统发育分析为芒属物种的进化和分类关系提供了新的证据。
南荻基因组着丝粒卫星重复序列分析
本研究还对南荻重要性状相关的基因家族,包括细胞壁生物合成、重金属离子转运、抗病和C4光合途径相关基因进行了鉴定分析。
除了最近的全基因组复制外,串联复制在这些基因家族的规模扩大中也发挥了重要作用。转录组数据显示大部分重复基因在所有转录组样本或预期样本中表达水平极低。
这些相关基因为解析南荻重要性状的遗传基础和开展分子辅助育种奠定了基础。也为更好的开展水稻等植物的环境适应性研究,以及探索植物多年生的遗传机制提供了参考。
中国科学院分子植物科学卓越创新中心韩斌研究组的博士研究生缪家顺以及正高级工程师冯旗博士是论文的共同第一作者。中国科学院分子植物科学卓越创新中心韩斌研究员、中国科学院植物研究所北方资源植物重点实验室及系统与进化植物学国家重点实验室桑涛研究员为共同通讯作者。这项研究受到中国科学院和国家自然科学基金委项目的资助。
作者:许琦敏
图片来源:分子植物卓越中心提供
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com