牛油果T2T参考基因组组装助力脂肪酸生物合成和抗病性相关基因鉴定
牛油果(Persea americana Mill.)属樟科鳄梨属常绿乔木,为著名的热带水果之一,原产于中美洲,果实富含多种不饱和脂肪酸,口感细腻,香气独特。为了深入理解牛油果的遗传信息,中国科学院西双版纳热带植物园(以下简称“版纳植物园”)植物基因组演化与次生代谢研究组,利用NGS、PacBio HiFi、ONT、Pore-C等测序技术对西印度品种的牛油果进行了全基因组测序,并成功组装了首个841.6Mb无间隙的牛油果基因组序列。
研究显示,西印度品种的牛油果包含40629个蛋白质编码基因,应用迭代识别和聚类方法预测了12个染色体特异性的着丝粒序列(CSCR)。这些CSCR序列结构复杂,包含了多种类型的TEs,具有较低的HiFi和ONT reads的覆盖深度,特别是染色体Pa03和Pa07的长着丝粒区域。研究团队应用荧光原位杂交(FISH)技术进一步验证了牛油果基因组序列中所有预测的着丝粒、端粒和核仁组织区域(NOR)的准确性。此外,研究团队鉴定了376个与疾病抗性相关的NLR基因,以及128个与脂肪酸生物合成相关的基因,其中在三酰甘油(TAG)形成阶段,Pa07g1095、Pa07g1091和Pa12g0002(FAD2基因)在果实中特异性表达,这一发现为理解牛油果中脂肪酸生物合成提供了新的见解。
研究成果以A telomere-to-telomere gap-free reference genome assembly of avocado provides useful resources for identifying genes related to fatty acid biosynthesis and disease resistance为题发表在园艺学期刊Horticulture Research上。版纳植物园植物基因组演化与次生代谢研究组联培博士生杨天宇和博士后蔡一帆为该论文的共同第一作者,杨云强副研究员和杨永平研究员为该论文的通讯作者。版纳植物园黄天萍高级工程师,博士后杨丹妮、博士研究生杨兴瑜、尹欣副研究员、昆明植物研究所章成君研究员也参与了该研究。该研究得到云南省“云岭学者”、国家自然科学基金、云南省博士后科学基金等项目支持。
图1. 端粒到端粒无缺口的牛油果基因组组装全景图。A基因组圈图。a)染色体长度示意图,修补缺口的位置标识为黑色,预测的着丝粒位置标识为金色,橙红色的柱状图展示了对应区域中序列的杂合位点密度;b)基因密度;c)重复基因密度;d)rRNA位点;e)HiFi reads覆盖深度;f)ONT ultra-long read覆盖深度;g)NGS覆盖深度;h)GC含量;i)基因组内共线性。以500-kb窗口及250-kb步进来滑窗计算密度与覆盖深度。B 12号染色体上的45s rDNA阵列。C FISH探针pITS1和pITS2(红色)以及pTEL(绿色)的荧光信号标识了牛油果有丝分裂中期染色体上核仁组织区和端粒的位置。
图2. 牛油果的着丝粒结构。A序列特征示意图的每一行分别展示了Pore-C互作信号接近缺失的区域、预测的卫星序列位置、CSCR位置、LTR/Gypsy位置、LTR/Copia位置和TIR位置。 CSCR,染色体特异性着丝粒重复序列;LTR,长末端重复序列;TIR,末端反向重复序列。Pore-C互作信号使用15-kb窗口进行统计。推测的卫星序列和转座子位置使用RepeatMasker确定,CSCR位置根据LASTZ比对结果确定。B 邻接树显示了CSCR的系统发育关系。标识为灰色的分支中包括7个高度同源的CSCRs,这7个CSCRs被合称为SCG。使用MAFFT的einsi算法进行CSCRs的序列比对。使用TreeBeST构建邻接树。C FISH探针pCEN(红色)以及pTEL(绿色)的荧光信号标识了牛油果有丝分裂中期染色体上着丝粒和端粒的位置。