您当前的位置:首页 > 科学研究 > 科研动态

基因组解析多脉冬青环境适应机制

发布时间:2022-01-14
来源:科技外事处

  冬青属(Ilex)植物广布于全球热带至温带沿海地区,植物形态和生境丰富多样,茶饮、药用和观赏等经济价值极高。东亚和南美洲的热带、亚热带地区是冬青属物种多样性热点地区,尤其是我国西南热带、亚热带地区种类最多。由于我国西南地区地理和气候类型变化多样,冬青属植物在该区域演化出大量狭域种和少数广布种。广布种的种群可通过歧化选择发生本地适应,进而发生遗传和表型特征的分化,这为冬青植物资源的保护和利用提供新的材料;然而歧化选择也可能因种群间频繁的基因交流而被减弱。迄今冬青科乃至整个冬青目都缺少已知的全基因组信息,极大限制了对冬青属植物环境适应和遗传分化的研究。 

    版纳植物园生物多样性研究组姚昕博士与合作者选择西南地区广布且观赏价值较高的多脉冬青(1)为研究对象,利用种群基因组学研究方法解析物种对不同海拔适应和遗传分化的分子机制。该研究整合Illumina二代、PacBio三代和Hi-C测序技术,通过从头组装出多脉冬青染色体水平的参考基因组。其中,contigs N50长度5,124,369 bp,最长的contig23,338,240 bpscaffords N50长度36,593,620bp,最长的scafford64,863,080 bp最终利用62scaffords获得的多脉冬青的全基因组727.1 Mb,利用BUSCO评分达到97.6%;基因组组装结果被定位到20条染色体上的覆盖度达到98.9%。基于高质量的组装结果,我们共注释出32,838个蛋白质编码基因,其中96.9%的基因能够在主流基因功能数据库中检索到其功能。 

    进一步结合菊分支(asterids)其他5个物种全基因组数据进行基因组加倍事件分析,发现冬青属经历了2次全基因组加倍事件(2)。基于多脉冬青高质量的参考基因组,对覆盖其所有分布海拔范围的21个种群、112个个体的种群基因组学分析表明绝大多数种群被分为4个分支,分别对应不同的地理位置和海拔(3a,b)。种群遗传结构和遗传主成分分析结果表明这些种群最可能存在4个祖先成分,低海拔(<1,500 m)和高海拔(>1,800 m)种群各对应2个祖先成分,中等海拔(1,500–1,800 m)种群是由低海拔和高海拔种群的祖先成分混杂组成(3c,d,e,f)。连锁不平衡衰减分析发现连锁不平衡系数衰减速度最快的是低海拔种群,其次是高海拔种群,最慢的是中等海拔种群。选择消除分析共鉴定出34个受海拔选择的候选基因(3g),它们的功能大多与响应生物和非生物选择压力有关。 

  相关研究结果以A chromosome-scale genome assembly for the holly (Ilex polyneura) provides insights into genomic adaptations to elevation in Southwest China为题,近日在SCI期刊园艺领域(Horticulture)排名第一的期刊Horticulture Research上正式发表。本研究不仅是整个冬青目中首个染色体水平参考基因组的研究,也为推进冬青属植物演化生物学研究,以及加快冬青园艺品种、茶饮和药用资源的选择驯化工作,提供了必要基础。 

  此外,我们使用冬青属主要分布区的主要语言(英语、汉语、葡萄牙语和西班牙语),在谷歌学术、Web of Sciences、中国知网和南美洲主要学术搜索引擎Scientific Electronic Library Online (SciELO)中检索冬青属植物应用的文献资料,综述该属植物在全世界各主要分布区被应用的现状。随后,讨论我们于2021年发表的世界冬青属系统发育研究结果和最近发表的冬青高质量参考基因组,对冬青属植物资源开发和育种工作的促进。这一成果以Utilization of the Hollies (Ilex L. spp.): A Review为题,近日在期刊Forests上正式发表。 

  以上研究受国家自然科学基金、中国科学院西部青年学者项目和云南省基础研究计划共同资助,在此一并感谢。 

 1. 多脉冬青(Ilex polyneura)落叶后的雌树(a)、果实(b)、雌花序(c)和雄花序(d) 

 

  2. 基于多脉冬青和菊分支(asterids)5个物种的全基因组加倍事件分析。图中Ilex表示多脉冬青(Ilex polyneura)Lsat表示莴苣(Lactuca sativa)Dcar表示胡萝卜(Daucus carota)Hann表示向日葵(Helianthus annuus)Mgut表示沟酸浆属植物(Mimulus guttatus)Slyc表示番茄(Solanum lycopersicum) 

 

  

 3.多脉冬青种群基因组学分析。a,本研究多脉冬青种群的分布信息。b,基于邻接法(neighbor-join)的多脉冬青种群系统发育关系。c,多脉冬青种群遗传结构分析(K=4)(绿色、蓝色和红色分别表示低海拔、中等海拔和高海拔种群)Dc,多脉冬青种群遗传主成分分析。f,多脉冬青种群遗传结构K值的交叉验证。g,多脉冬青种群连锁不平衡衰减分析(黑色、绿色、蓝色和红色分别表示所有种群以及低海拔、中等海拔和高海拔种群) 

本文作者:姚昕

责任编辑:zhangwj_151c53
附件: