随着越来越多的物种基因组测序完成以及高通量测序技术的发展,公共数据库中积累了大量的组学数据,这为从基因家族水平挖掘功能基因并进行基因功能解析提供了极大便利。
以植物相关研究为例,这类研究有一个基本的思路:首先从特定物种基因组和转录组信息中进行感兴趣的基因家族成员挖掘,这种挖掘一般有两种方法,一种是根据该基因家族的特定结构域信息进行,一种则是根据模式植物中同源基因信息进行;初步获得该物种中该基因家族成员之后,还要借助公共数据库进行功能结构域预测分析来进一步确认;得到确认的成员接着主要进行生物信息学分析;然后进行表达模式分析,如果公共数据库中有该物种的转录组数据,可以首先利用公共数据进行该家族成员的表达模式初探,表达特异的成员可以作为后续功能分析的首选,另外就是通过逆境处理进行成员的逆境响应模式探索;之后筛选出特异表达的成员进行功能分析,这就又回到了基因功能研究中。
但是需要注意的是,既然这类研究是从公共数据库开始,并且研究的基本思路相对模式化,所以也就很容易“撞车”。比如在去年茶树基因组序列公布之后,我们初步做了一个实验方案(具体内容附后)想对茶树HD-Zip家族成员作一上述“模式化”分析,但是由于用于实验的茶苗没有准备妥当,就暂时把这份计划搁置起来。结果今天早上一大早就收到了NCBI的推送,南农庄老师课题组对茶树HD-Zip家族成员鉴定研究的文章在线了~~~
Abstract:
Tea plant (Camellia sinensis (L.)O. Kuntze) is a perennial evergreen woody plant, and its leaves contain various beneficial ingredients and have healthy efficacy. HD-Zip (homeodomain-leucinezipper) transcription factors (TFs) are widely distributed in plants and play an important role in plant growth and environmental response. To date, knowledge on HD-Zip gene family in tea plant is still limited. In this study, 33 HD-Zip TFs were selected based on the genomic and transcriptomic databases of tea plant.The conserved domains and common motifs of these TFs were predicted and analyzed. These 33 Cshdz TFs were divided into four groups (HD-Zip I, HD-Zip II, HD-Zip III,and HD-Zip IV). The interaction network of the HD-Zip proteinsof tea plant was established based on the data of Arabidopsis. In addition, the expression levels of these Cshdz genes in tea plant cv.'Longjing43' were detected and analyzed under five abiotic stress treatments. Results showed that the different expression profiles of Cshdz genes were associated with different abiotic stress treatments. Our findings suggested a potential relationship between the resistance of tea plant and its Cshdz genes.
看到文章的一刹那既有惋惜又很高兴,惋惜自己的计划要搁浅了,高兴的是自己的计划还是靠谱的。
由于最近sci-hub.tw不太稳定,文章的原文也就没能获取。后面附上我们当时制定的初步计划,也让这份搁浅见一见阳光~~~
附:
全基因组系统鉴定与功能分析茶树HD-ZIP家族基因
1 研究背景
同源异型结构域(Homeodomain),即HD,是由homeobox(HB)编码的一个含有60个氨基酸的保守结构域,包含该结构域的转录因子在真核生物中普遍存在。玉米的KNOTTED1基因是植物中第一个鉴定到的HB基因,它可以导致玉米叶片的皱结。自此之后,植物中大量的编码HD基因就被鉴定出来,而HD-Zip(homeodomainassociated to a leucine zipper)基因家族作为重要的编码HD-containing蛋白也开始得到广泛研究。
HD-Zip家族成员在HD结构域下游还包含一个亮氨酸拉链(leucine zipper,LZ)结构域,根据其结构特点可以将HD-Zip家族再分为4个亚家族(HD-ZipI~IV),各亚家族结构如图1所示,HD-Zip家族成员众多(表1),分别发挥着各自的功能(表2)。
图1. HD-Zip基因功能结构域组成(Federico et al. 2007).
表1. 不同植物中HD-Zip家族成员数量.
作为转录因子类基因家族,HD-Zip家族成员除参与多种逆境胁迫外,它们还有一些特殊的功能,比如响应蓝光信号、荫蔽逃避、参与分生组织调节、侧生组织形成、毛状体形成以及花青素积累等。向日葵的HAHB10基因属于HD-Zip II亚家族成员,主要在成熟叶片中表达,且黑暗处理后表达量显著提高,在拟南芥中过表达HAHB10,转基因株系叶片的叶绿素和花青素含量升高;拟南芥HD-Zip I亚家族成员ATHB16负向调控叶片扩大,同时响应蓝光信号调控下胚轴生长,过表达株系长日照下抑制开花,短日照下促进开花,抑制表达下反之;miR165/166调控拟南芥HD-Zip III家族基因,进而调控分生组织形成。目前在茶树中,并没有对该基因家族进行系统鉴定和功能分析。对于茶树来说,遮阴和光照对叶片的物质代谢如儿茶素、氨基酸等有重要影响进而影响茶叶品质,而叶片和分生组织的发育又影响着茶叶的产量,此外,花青素还是儿茶素形成的前体物质之一,花青素的积累影响着儿茶素的含量,miR165/166还参与茶树氮代谢和低温响应。以往对于HD-Zip家族基因功能的研究已经证实该家族成员参与以上过程的调节,因此有必要对该基因家族成员在茶树中的功能进行分析,进而进一步理解HD-Zip家族基因对上述生物过程的调控作用,同时为筛选特异种质材料提供基因层面的支持。
表2. HD-Zip基因涉及的功能.
2 研究思路
2.1 茶树HD-Zip家族基因获得
首先从Tea tree Genome Database(http://www.plantkingdomgdb.com/tea_tree/)下载茶树基因组序列,然后分别利用拟南芥和大豆的HD-Zip家族基因氨基酸序列进行本地Blast分析(P=0.001)。对于获得的序列分别运用Pfam (http://pfam.xfam. org/)和SMART (http://smart.embl-heidelberg.de/)分析每个序列中是否同时含有HD (PF00046)和LZ (PF02183)结构域,只有同时含有这两个结构域的序列保留下来,然后序列比对去除冗余序列保留下来的就是茶树HD-Zip家族基因。
2.2 茶树HD-Zip家族基因序列分析
对于获得的茶树HD-Zip家族基因序列,利用在线工具ExPASy(http://web.expasy.org/computepi/)分析编码蛋白的基本理化性质;利用WoLF PSORT(https://wolfpsort.hgc.jp/) 和 Plant-mPLoc(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/)预测编码蛋白的亚细胞定位;利用GSDS(http://gsds.cbi.pku.edu.cn/index.php) 分析基因结构;利用MEME (http://meme-suite.org/tools/meme)分析motifs;利用Clustal X 1.83 和 MEGA6.0软件对茶树和其他植物中的HD-Zip基因进行系统进化分析。
2.3 茶树HD-Zip家族基因表达模式分析
利用已公开的转录组数据库,对茶树HD-Zip家族基因成员进行表达模式分析。
2.4 茶树HD-Zip家族基因逆境响应分析
以两年生的‘黔茶1号’、‘黔茶8号’扦插苗为材料,以盐害、干旱、遮阴、低温、ABA、GA等6种处理,分析不同成员的逆境胁迫响应。不同处理设置如下:
(1)盐害处理:100mM NaCl浇灌处理24h,分别在0/4/8/12/24/48h进行取样;
(2)干旱处理:茶苗用清水冲洗干净,放入10% PEG6000溶液中24h,分别在0/4/8/12/24h进行取样;
(3)遮阴处理:黑色遮阴网(20%左右透光度)覆盖3-5天,分别在0/1/2/3/4/5d取样;
(4)低温处理:4℃处理3天,分别在0/4/8/12/24/48/72h取样;
(5)ABA/GA处理:分别用100ml ABA和GA3对整株进行均匀喷施,在0/4/8/12/24h取样。
以上取样部位均为顶端第2或3叶,取样后液氮速冻,-80℃冰箱保存,每个处理20棵。不同处理表达量变化显著的基因进入后续分析。
扩大材料范围,检测筛选出的表达量变化显著基因在不同材料中的表达情况,筛选特异资源。
2.5 茶树HD-Zip家族基因功能分析
对上文筛选出的基因挑选3~5个进行遗传转化研究,在拟南芥中过表达进行功能分析。
责任编辑:千鹤茶苗