近五年来,随着‘云抗10号’基因组文章发表,茶树基因组的文章层出不穷,组装质量也由Scaffold级别上升至染色体水平。高质量的茶树基因组中蕴藏着巨大的生物学价值,是重要农艺性状基因挖掘、功能成分开发利用、遗传育种的基础,亟待科研工作者进一步开发与利用,而注释和收集茶树基因组中每个基因的功能和详细信息尤为重要。
近期,Beverage Plant Research 在线发表了南京农业大学房婉萍教授研究团队题为TeaPGDB: Tea Plant Genome Database 的研究论文。该论文针对目前茶树基因组数据注释、分析和利用依然匮乏的现状,对已发表茶树基因组文章中的数据进行了注释和分析。该研究有助于研究人员检索和分析基因组数据,充分了解他们所关注的茶树关键基因,以应用于茶树分子育种领域研究。
TeaPGDB全面收集、整理和注释已发表茶树基因组(包含叶绿体和线粒体基因组)文章中的基因组和蛋白质组数据,注释的结果包含基因家族鉴定、GO注释、KEGG注释、基因位置信息、基因和蛋白质序列、基因结构、信号肽预测等。当然,用户可以在检索界面输入gene id以获取对应的注释结果(图1)。研究人员如果以近期发表dan的高质量茶树基因组数据,如:‘舒茶早’(2020年)、‘黄棪’(2021年)基因组等作为参考基因组,此基因组注释结果将方便他们掌握所关注基因的详细信息,加快分子生物学研究进程。系统还提供了其他的在线工具,如BLAST、SSR search等。BLAST工具中含有拟南芥、水稻和已发表茶树基因组的茶树品种等较多植物的基因组、蛋白质、CDS序列作为参考数据库,用户使用BLAST工具可对未知序列进行比对分析,获得未知序列的同源序列,便于开展该序列功能预测和分析(图2)。SSR search工具包含茶树基因组中的简单重复序列,用户通过输入茶树染色体名称和序列在染色体中的起始和终止位置以及碱基序列,得到相应的SSR检索结果。TeaPGDB还包含茶叶风味基因页面(Tea flavor genes),收集和挖掘茶叶品质相关的成分:儿茶素、咖啡因、茶氨酸的生物合成基因,并提供这些基因的注释结果,以促进茶叶品质成分的分子机理研究。
南京农业大学茶学专业硕士生雷小刚为该论文第一作者,房婉萍教授和陈飞博士为通讯作者。加拿大曼尼托巴大学植物科学系邹中伟博士、上海市农业科学院林木果树研究所周琳博士参与了该研究工作。研究得到了国家重点研发项目(2020YFE0202900)、国家自然科学基金项目(31972460, 31870680)、江苏省重点研发项目(BE2019379)等的资助。
南京农业大学房婉萍教授研究团队主要研究领域是茶树分子育种与高效栽培体系建设。近年来,研究团队主要致力于茶树逆境响应分子机制的研究以及茶叶品质与环境调控技术的研发与应用。
责任编辑:千鹤茶苗