植物半寄生习性会加快质体NDH基因假基因化和丢失
质体是绿色植物中特有双层膜结构的细胞器,内含质体基因组遗传物质和蛋白质合成系统。根据其所含色素和执行功能的不同可分为叶绿体、有色体、黄化体、造油体和淀粉体等。质体最为熟知的功能进行光合作用场所,内部的质体基因组(或称叶绿体基因组)为保守的环状四分体结构。在植物界中,约1.0%被子植物通过“吸器”从寄主植物“盗取”营养物质(称为寄生植物),它们分散在12个目中,其中列当科和檀香目占据了寄生植物的95%。依据寄生习性的差异,寄生植物可分为半寄生型和全寄生型。由于寄生植物对光合作用的依赖性可能要弱于自养植物,从而质体基因受到放松的选择压力,其基因组结构已发生变化,或功能基因发生假基因化或丢失。比较清楚的是(半)寄生植物最早发生假基因化或丢失是NDH基因(NA(D)H dehydrogenase genes)成员,且这些基因的演化事件可能是独立发生。由于已发表的质体基因组数据来源于关系较远的科属,取样比较随机,难以追溯NDH基因是如何,以怎么样的方式发生假基因化或逐步片段化或丢失。因此,版纳植物园生物多样性研究组团队和合作者选取了半寄生类群马先蒿属(Pedicularis L.)中的单系类群斗叶组(sect. Cyathophora H.L.Li)(图1)为研究对象,借助系统发育比较分析方法来解析NDH基因的演化。
研究团队通过对斗叶组所有6种13份样品和其他5种马先蒿,以及4种非马先蒿属的半寄生和自养植物进行了全基因组浅层测序和从头组装(GetOrganelle软件包)获得完整的质体基因组。为了更好地解析基因是如何逐步假基因化、片段化和丢失,研究团队首次提出了将基因状态划分为四个阶段:完整的功能性基因(0)、长度完整的假基因(有提前终止子)(1)、片段化的假基因(2)和完全丢失(3);并可进一步分成三种类型:功能型(0)vs非功能型(1/2/3)、序列完整型(0/1)vs片段化或丢失型(2/3)和基因存在型(0/1/2)vs完全丢失型(3)。基于基因精细注释、系统发育重建和比较演化等分析,我们研究得到以下主要研究结果:(1)所有马先蒿物种和外类群的质体基因组都是保守的四分体结构,而在斗叶组中质体基因组的IR区向SSC区发生三种类型的扩张(图2A)。祖先状态重建分析显示斗叶组的质体基因组很可能是经历了1次从IR区向SSC延长,然后出现2次独立IR区的收缩(图2B)。(2)马先蒿属的质体基因组中11种NDH基因,以及accD和ccsA基因发生了假基因化或完全丢失,且accD在核基因转录中找到了同源基因拷贝。基因祖先状态重建分析显示NDH基因、accD和ccsA基因在马先蒿属中发生了多次独立的假基因化、片段化或丢失(图3)。选择压力分析显示半寄生植物或马先蒿属的质体基因(如pet、psa、rpl、infA、ndhE)大多受到放松选择,但也有一些别基因(如accD、ccsA、ndhG)受到了强化选择,因此,大部分的NDH基因的假基因化、片段化或丢失与放松选择有关,而ccsA基因和ndhG基因的演化与IR区的扩张/收缩有关联,以及 accD基因存在核基因的同源拷贝有关。
马先蒿属斗叶组是一个只有5.0-7.0百万年的年轻草本类群,该研究包括了所有已知6个种,且采用的居群取样策略,揭示了具有寄生习性类群的质体基因组发生了快速的演化,表现在NDH基因和质体基因组结构稳定性,为理解寄生植物质体基因组演化提供了一个很好例证,相关研究结果以Plastid NDH pseudogenization and gene loss in a recently derived lineage from the largest hemiparasitic plant genusPedicularis (Orobanchaceae)为题发表在Plant and Cell Physiology上。生物多样性研究组2017级硕士研究生李鑫为论文第一作者,版纳植物园郁文彬研究员和昆明植物所李德铢研究员为共同通讯作者。该研究得到了国家自然科学基金项目、中科院项目、云南省项目等经费的支持。
图1. 马先蒿属斗叶组物种
A. 大王马先蒿大王变种;B. 大王马先蒿洛氏变种;C. 大王马先蒿立氏变种;D. 未知种(近缘灌丛马先蒿);E. 灌丛马先蒿;F. 拟斗叶马先蒿;G. 华丽马先蒿;H. 斗叶马先蒿
图2. 马先蒿属斗叶组及其他物种质体基因组的结构变异类型(A)和质体基因组结构变异类型历史状态重建(B)(红色箭头为基因转录方向,ψ为假基因,红色边框为IR/SSC边界基因)
图3. 马先蒿属中质体基因组假基因祖先状态重建
A:“ER”模型,根据基因功能和序列完整性分四种状态推断祖传状态,即完整的功能性基因(0)、完整长度的假基因(有提前终止子)(1)、片段化的假基因(2)和完全丢失(3)
B:Dollop简约模型,基因状态分三种类型检测:1)功能型(0)→非功能型(1/2/3);2)序列完整(0/1)→片段化或丢失(2/3);3)基因存在(0/1/2)→丢失(3)