第42卷 第4期 VoI.42 No.4 河南科技学院学报 Journal of Henan Institute of Science and TechnoLogy 2014年8月 Aug.2014 dot:10.3969 ̄.issn.1008-7516.2014.04.002 小麦SOD基因的电子克隆及生物信息学分析 孙双燕,李东方,张团,张胜利 (河南科技学院,河南新乡453003) 摘要:以NCBI中的EST数据库为主要数据来源,以一系列生物信息学软件为T具,进行了超氧化物歧化酶 (SOD)基因的电子克隆及生物信息学分析.结果表明:通过电子克隆方法获得了SOD基因的编码区全长序列.该 预测的SOD蛋白质氨基酸序列与数据库中同类基因的蛋白质氨基酸序列具有极高的相似性,并且含有完整的 保守结构域;电子克隆到的SOD基因编码的不是分泌蛋白,也不是膜蛋白,而是胞质蛋白.通过某个基因的一个 EST序列采用电子克隆的手段进行基因全长的电子拼接是可行的. 关键词:SOD基因;电子克隆;小麦 中图分类号:s512 文献标志码:A 文章编号:1008—7516(2014)04—0007—04 Genes in silico cloning and bioinformatics analysis of SOD in COmmon wheat Sun Shuangyan,Li Dong ̄ng,Zhang Tuan,Zhang Shengli (Henan Institute of Science and Technology,Xinxiang 453003,China) Abstract:Taking EST database in the NCBI as the main data source,with a series of bioinformatics software as tools,the SOD gene in silico cloning and bioinformatics analysis was been done.The results showed that obtained SOD genes coding region of full-length sequence through in silieo cloning.The prediction amino acid sequence of SOD protein has a very high sequence similarity with the protein amino acid of similarity genes in the protein database of NCBI,and contains a complete conservative domain structure.The encoding protein of SOD gene obtained in this study by in silico cloning is not secreted proteins,membrane protein,but the cytoplasmic protein.Gene full-length stitching of encoding region is feasible by means of in silico cloning through a relative EST sequence. Key wOrds:supefoxide dismutase gene;in silico cloning;wheat 超氧化物歧化酶(superoxide dismutase,SOD)是一种源于生命体的活性物质,能消除生物体在新陈代 谢过程中产生的过量的超氧自由基类有害物质.SOD具有防止小麦细胞膜过氧化功能,在小麦干旱、寒冷、 贫瘠、病害等逆境环境下含量会增加,X ̄/J'麦正常生长起保护作用.因此,SOD基因的克隆对于小麦SOD 相关的逆境抗性机理研究具有重要的理论意义I ,对小麦分子育种也具有一定的参考价值.研究还发现, s0D能影响小麦花药的育性【2J.对于小麦来说,其庞大的基因组(约17 G,是人类基因组的5倍多)、异源多 倍体(异源六倍体)使功能基因克隆非常困难.随着高通量二代测序技术的不断成熟与广泛应用,转录组 测序、EST测序等累积了海量的DNA序列数据,这为进行基因的电子克隆提供了丰富的DNA数据 J. 本研究以NCBI中的EST数据库为主要数据来源,采用与前人类似的方法进行了小麦SOD基因的电子 克隆研究. 收稿日期:2014—06—16 基金项目:国家级大学生创新训练项目(201310467068) 作者简介:孙双燕(1990一),女,河南周口人. 通信作者:张胜利(1976一),男,河北鸡泽人,博士,副教授.主要从事植物分子生物学研究 7 孙双燕等:小麦SOD基因的电子克隆及生物信息学分析 表1 SOD基因蛋白序列与NCBI蛋白质数据库blastp比对结果 Tab.1 The result of blastp between SOD amino acid and the protein database of NCBI 第4期 注:物种名称前面标P的表示为预测的蛋白;标H的表示为假定的蛋白. 2.3 SOD预测蛋白的生物信息相关分析 利用ProtParam程序对SOD预测蛋白进行蛋白质理化性质分析.结果表明:该蛋白的相对分子质量 为24 601.0 Da,等电点(PI)为7.14;负电荷残基(Asp+Glu)总数与正电荷残基(Arg+Lys)相同,均为24,分 子式为c… Hm.N洲O S,;在哺乳动物网状细胞(体外)中的半衰期是30 h;不稳定系数(instability index) 为28.59,表明该蛋白比较稳定;平均疏水性(grand average ofhydropathicity)为一0.265,表明该蛋白为亲水 蛋白. SOPMA软件对SOD预测蛋白进行的二级结构分析结果表明:该蛋白质含仪螺旋(Alpha helix)107 个,占47.56%;含 片层(Beta sheet)39个,占17.33%;含转角(turn)16个,占7.11%;含卷曲(coil)63个,占 28%.应用TMHMM预测结果表明:本研究电子拼接的SOD蛋白不是跨膜蛋白,没有跨膜螺旋.利用 Phobius、SignalP等软件进行信号肽预测,证明该SOD蛋白不含有信号肽.上述预测结果暗示,本研究电 子克隆到的SOD基因编码的不是分泌蛋白,也不是膜蛋白,而是胞质蛋白. 3讨论 植物基因克隆有多种方法,常用的有图位克隆法、同源序列法、突变体筛选法、差异筛选法等【3j.不同 方法各有其优缺点,在克隆基因时应根据被克隆基因的特点、供体基因组大小、遗传图谱和物理图谱的 完备性等选择使用.由于小麦具有巨大的基因组,对其进行基因克隆及验证相当困难,因此,从事小麦分 子生物学相关研究的学者们都在积极探索小麦基因克隆的快速有效方法.随着新一代高通量测序技术 的不断完善与广泛应用【l21,包括EST序列在内的基因表达序列数据日益膨胀 1,这为进行基因的电子克 隆提供了十分丰富的数据.前人在电子克隆方面已经做了大量的工作 ,为开展此类研究奠定了坚实的 基础. 与RACE等其他技术相比,电子克隆具有简便、快速、节省经费等优点,如张德礼等17l ̄lJ用电子克隆 结合实验验证的方法成功克隆了人类新基因C17ORF2的eDNA(GenBank登录号:AY074907和 9 2014年 河南科技学院学报(自然科学版) BKO00260),黄新杰H利用此法克隆到了3个小麦条锈病相关抗性基因等.本研究采用与前人类似的方法 进行了小麦SOD基因的电子克隆,克隆到了SOD基因的编码区全长序列,该预测的SOD蛋白质氨基酸 序列与数据库中同类基因的蛋白质氨基酸序列具有极高的相似性,并且含有完整的保守结构域,这为 进一步通过实验手段克隆该基因奠定了良好基础,也为探索小麦逆境抗耐性基因快速克隆方法提供了 一定参考. 参考文献: 【1]李娟,杨立新,郑文寅,等_/J、麦FeSOD基因的克隆与序列分析[J】.核农学报,2013,27(8):1 1 1 1-1 1 17. 【2】李莉,张改生,张龙雨,等.小麦生理型与遗传型雄性不育相关基因锰超氧化物歧化酶(Mn—SOD)及果糖1,6一二磷酸醛缩 酶(FBA)的表达分析『J1.农业生物技术学报,2012,20(3):225—234. 【31乔纳森・佩夫斯纳.生物信息学与功能基因组学[MI.孙之荣,译.北京:化学T业出版社,2006. 【4]黄新杰.三个小麦抗条锈病相关基因的全长cDNA克隆及生物信息学分析[D].杨凌:西北农林科技大学,2007. [51 Boguski M S,Lowe T M,Tolstoshev C M.dhEST-database for“expressed sequence tags”fJ1.Nature Genetics,1993,4(4):332—333. 【61 dbSTS:database of“Sequence Tagged Sites”.[2014—06—101.hnp://www.ncbi.nlm.nih.gov/dbSTS/. [7】张德礼 晓静,凌伦奖,等.人类sR蛋白超家族新成员一SFRSI2(SRrp508)的基因克隆和特性分析[J1.遗传学报,2002,29 (5):377—383. 『8]Ahschul S F,Madden T L,Sch ̄iffer A A,et .Gapped BLAST and PSI-BLAST:a new generation of protein database search programs[J].Nucleic Acids Research,1997,25:3389—3402. f9]ORF FinderfDB/OL].[2014-06-1 o1.http:fWWW.ncbi.nlm.nih.gov/gorf/gorf.htm1. 【10】SIB Bioinformatics Resource Portal[DB/OE1.[2014-06-10].http://www.expasy.org/proteomics. [1 1】Marchler—Bauer A,Lu S,Anderson J B,et a1.CDD:a conserved domain database for the funotional annotation of proteins Nucleic Acids Research,20 1 l,39:225—229. 【1 2】Wicker T,Taudien S,Houben A,et a1.A whole-genome snapshot of 454 sequences exposes the composition of the badey genome and provides evidence for parallel evolution of genome size in wheat and barley[J].Plant Journal,2009,59(5):7 1 2—722. [13】Gunaratne P H,Coarfa C,Soibam B,et a1.miRNA data analysis:next-gen sequencing[J].Methods in Molecular Biology,2012,822: 273-288. (责任编辑:邓天福) 10