二级结构
二级结构(英语:Secondary structure)在生物化学及结构生物学中,是指一个生物大分子,如蛋白质及核酸(DNA或RNA),局部区段的三维通式。然而它并不描述任何特定的原子位置(在三级结构中描述)。
二级结构是由生物大分子在原子分辨率结构中所观察到的氢键来定义的。蛋白质的二级结构通常是以主链中氨基之间的氢键模式来定义〈与主链-侧链间以及侧链-侧链间的氢键无关〉,亦即DSSP的定义。[1]而核酸的二级结构是以碱基之间的氢键来定义。
在二级结构中,特定的氢键模式往往伴随着其他一些结构特征;但如果只考虑这些结构特征而忽略氢键本身,则会导致所定义的二级结构不准确。例如,蛋白质的螺旋中的残基都分布在拉氏图(以主链二面角为坐标)的特定区域,因此二面角位于这一区域的残基都会被认为参与形成“螺旋”,而不论它是否真正的存在对应氢键。其他稍微不准确的定义多是应用曲线微分几何的观念,如曲率及扭量。也有一些结构生物学家以肉眼观察通过软件显示的蛋白质结构来决定其二级结构。
对生物大分子的二级结构含量可以以光谱来初步估计。对于蛋白质,最常用的方法是圆二色性(Circular dichroism), (利用长紫外线,波长范围170-250nm)。在获得的光谱吸收曲线上,α螺旋结构会在208nm及222nm两处同时出现极小值,而204nm和207nm处出现单个极小值则分别表示存在无规卷曲和β折叠结构。另一个较常用的方法是红外光谱,它可以侦测因氢键所造成胺基的震荡。而光谱中,测定二级结构最准确的方法是利用核磁共振光谱所纪录的化学位移,由于仪器和样品制备上的原因,这一方法较为少用。
类型
蛋白质
几何属性 | α-螺旋 | 310 螺旋 | π-螺旋 |
---|---|---|---|
每一圈的残基 | 3.6 | 3.0 | 4.4 |
每个残基的翻译 | 1.5 Å(0.15 nm) | 2.0 Å(0.20 nm) | 1.1 Å(0.11 nm) |
螺旋半径 | 2.3 Å(0.23 nm) | 1.9 Å(0.19 nm) | 2.8 Å(0.28 nm) |
间距 | 5.4 Å(0.54 nm) | 6.0 Å(0.60 nm) | 4.8 Å(0.48 nm) |
蛋白质的二级结构包含局部残基之间由氢键所调节的相互作用。最普遍的二级结构就是α螺旋及β折叠。经计算后发现其他螺旋,例如310螺旋及π螺旋,在能量上有着有利的氢键模式,但这些螺旋却是在自然的蛋白质中是很稀有的,要α螺旋在中央进行不利的骨架包装后,才可在末端中发现。紧的转角、松开及灵活的环会连结更多“规则的”二级结构。任意形并非真正的二级结构,但却是一类缺乏规则的二级结构的形态。
氨基酸在形成不同的二级结构上有着不同的能力。脯氨酸及甘胺酸会在转角上出现,并且可以瓦解α螺旋骨架的规则形态,但两者却有着不正常的形态能力。在蛋白质内采用螺旋形态的氨基酸有蛋氨酸、丙氨酸、亮氨酸、谷氨酸及赖氨酸(氨基酸单字母编号为“MALEK”);相反,大型的芳香性残基(色氨酸、酪氨酸及苯丙氨酸)及Cβ分枝的氨基酸(异亮氨酸、缬氨酸及苏氨酸)则采用β折叠形态。但是,若单以序列来看,这些都不足以构成一个可靠的方法来预测二级结构。
DSSP编号
DSSP是“Dictionary of Protein Secondary Structure”的缩写,它是一编文章正式列出已知三维结构的蛋白质二级结构。DSSP编号一般是用单一英文字母来描述蛋白质二级结构。[3]二级结构是根据氢键模式来指定的。[4][5]
- G:3转角螺旋(亦即310螺旋)。最短长度为3个残基。
- H:4转角螺旋(α螺旋)。最短长度为4个残基。
- I:5转角螺旋(π螺旋)。最短长度为5个残基。
- T:氢键转角(3、4或5个转角)。
- E:平行的β折叠,或/及反平行的折叠形态(延伸链)。最短长度为2个残基。
- B:独立β桥内的残基(一对β折叠氢键)
- S:弯曲(唯一非氢键的指定)
所有不是以上形态的残基,在DSSP都是以空格来指定的,而有时则以C来代表卷曲或L来代表环。螺旋(即G、H及I)及折叠形态都需要一定的长度。这即是指两个在一级结构邻接的残基必须形成相同的氢键模式。如果螺旋或折叠的氢键模式太短,就会分别以T或B来编码。当中亦有其他蛋白质二级结构编号,但却较少使用。
DSSP氢键定义
由于二级结构是以氢键来定义,所以氢键的正确定义十分重要。DSSP内二级结构的标准氢键是一个纯粹静电模型。对于羰基的碳及氧,指定的电荷分别为:
而静电能是:
根据DSSP,一个氢键只有在E少于-0.5 kcal/mol才会存在。虽然上述的方程式都只是一个相对于氢键能量的估算,但都一般接受作为定义二级结构的工具。
蛋白质二级结构预测
早期蛋白质二级结构预测的方法是建基于氨基酸形成螺旋或折叠的倾向,而有时须联同估计形成二级结构的能量的方法来使用。这些方法在预测残基的三种状态(螺旋、折叠或卷曲)可以有约60%的准确性,若使用多重序列比对可以将准确性大幅提升至80%。多序列比对可以知道氨基酸在某一位置的完正分布(包括在其附近的位置,一般在每一边的7个残基),而演化过程提供了结构趋向更明确的图画。例如,在蛋白质某位置的甘胺酸,本身已表明那是一个任意形。但是多序列对比可以发现,在接近十亿年演化后95%的蛋白质中,那是一个有利螺旋的氨基酸。再者,若在那位置检测平均疏水性,亦会发现其残基可溶性是与α螺旋一致。综合来说,这些因素显示原先蛋白质内甘胺酸是α螺旋结构,而非任意形。多种方法都会结合已有的数据来组成三种状态的预测,这些方法有神经网络、隐马尔可夫模型及支持向量机。现代预测方法亦可在每一个位置的预测结果提供信赖分数。
二级结构预测方法一直不断地在校准,例如EVA实验。基于约270个星期的测试,最准确的方法要算是PsiPRED(页面存档备份,存于互联网档案馆)、SAM[永久失效链接]、PORTER、PROF及SABLE(页面存档备份,存于互联网档案馆)。有趣的是,在这多种方法中找出共识或一致,并不能提升它们的准确性。最大改善的地方似乎是在β股的预测,因为所使用的方法会忽视一些β股段。整体上而言,最高的预测准确性只可以达90%,因DSSP的标准方法的性质,与校准的预测相违背。
准确的二级结构预测是三级结构预测的重要原素。例如一个确定的βαββαβ二级结构模式,就是铁氧化还原蛋白的记号。
核酸
核酸亦有二级结构,大部分都是单股核糖核酸[来源请求](RNA)分子。RNA二級結構可以分為螺旋(緊接的碱基对)及不同种类的环(被螺旋围绕的不成对核苷酸)。茎环结构是一个碱基对螺旋结构,末端为短少的不成对环。这种茎环结构非常普遍,并且是建构大型结构模体,如三叶草结构(即如在转运RNA中的四个螺旋结点)的基本单位。内环结构(在长碱基对螺旋中的短而不成对碱基)及膨出(在螺旋股中额外插入,但却在相对股中没有配对的碱基)亦很经常会出现。最后,伪结及base triples亦会出现在RNA。
由于RNA二级结构差不多全都是由碱基对作为中介,它可以说是确定在一个分子或复合物中哪些碱基成对。但是,传统的华生—克里克碱基对并非唯一在RNA的配对方法,霍氏配对方法亦很普遍。
脱氧核糖核酸(DNA)的二级结构主要是各种形式的螺旋,特别是B型双螺旋、此外还有A型双螺旋、Z型双螺旋、三螺旋和四螺旋结构等[6]。除了上述3种最常见的标准二级结构(B型、A/C型和Z型)外,细胞内DNA在特殊条件下亦可形成其他几种非标准二级结构,如弯曲(bending)、十字形(cruciforms)、三螺旋(triple helix)、滑动(slipped mispaired DNA,SMP-DNA)错配和剪辑翻转(base flipping)等[6]。
RNA二级结构预测
生物信息学的其中一种应用是使用预测的RNA二级结构来搜寻用作RNA功能形式而非编码的基因组。举例来说,小分子RNA有着由小内环中断的长茎环结构。计算可能的RNA二级结构可以用动态规划方法,但是它不能侦测出伪结或是其他碱基对没有全面网罗的情况较通用的方法有随机上下文无关语法。Mfold是一个使用动态规划的网站。
在很多RNA分子,二级结构对RNA正常功能非常重要,有时甚至于较序列重要。这可以帮助用于分析非编码RNA。RNA二级结构可以用电脑来提升预测准确性。[7],而其他生物信息学的应用会使用一些二级结构的概念来分析RNA。
应用
蛋白质及RNA二级结构都可以用在协助多重序列比对。这种比对在加入有关的二级结构资料后,可以变得更为准确。但有时对RNA却不太有用,这是由于RNA碱基对比序列更受到高度保存。一些不能比对一级结构的蛋白质,二级结构有时亦可以找出它们之间的关系来。
参考文献
- ^ C Branden; J Tooze. Introduction to Protein Structure 2nd ed. New York: Garland Publishing. 1999.
- ^ Steven Bottomley. Interactive Protein Structure Tutorial. 2004 [January 9, 2011]. (原始内容存档于2010-12-19). (页面存档备份,存于互联网档案馆)
- ^ Kabsch W; Sander C. Dictionary of protein secondary structure: pattern recognition of hydrogen-bonded and geometrical features. Biopolymers. 1983, 22: 2577–2637. PMID 6667333.
- ^ L. Pauling; R.B Corey. Configurations of polypeptide chains with favored orientations of the polypeptide around single bonds: Two pleated sheets. Proc. Natl. Acad. Sci. Wash. 1951, 37: 729–740.
- ^ L. Pauling; R.B. Corey and H.R. Branson. Two hydrogen-bonded helical configurations of the polypeptide chain. Proc. Natl. Acad. Sci. Wash. 1951, 37: 205–211.
- ^ 6.0 6.1 杨荣武. 第六章第三节:核酸的高级结构. 生物化学原理 2. 北京: 高等教育出版社. 2012. ISBN 978-7-04-035696-0. OCLC 910676076.
- ^ M. Zuker. Computer prediction of RNA structure. Methods in Enzymology. 1989, 180: 262–88.
延伸阅读
- Branden C, Author J. Introduction to protein structure 2nd. New York: Garland Science. 1999. ISBN 978-0815323051.
- Pauling L, Corey RB. Configurations of Polypeptide Chains With Favored Orientations Around Single Bonds: Two New Pleated Sheets. Proc. Natl. Acad. Sci. U.S.A. 1951, 37 (11): 729–40. PMC 1063460 . PMID 16578412. doi:10.1073/pnas.37.11.729. (The original beta-sheet conformation article.)
- Pauling L, Corey RB, Branson HR. The structure of proteins; two hydrogen-bonded helical configurations of the polypeptide chain. Proc. Natl. Acad. Sci. U.S.A. 1951, 37 (4): 205–11. PMC 1063337 . PMID 14816373. doi:10.1073/pnas.37.4.205. (alpha- and pi-helix conformations, since they predicted that helices would not be possible.)
参见
外部链接
- NetSurfP – Secondary Structure and Surface Accessibility predictor(页面存档备份,存于互联网档案馆)
- PROF(页面存档备份,存于互联网档案馆)
- ScrewFit
- PSSpred(页面存档备份,存于互联网档案馆) A multiple neural network training program for protein secondary structure prediction
- Genesilico metaserver Metaserver which allows to run over 20 different secondary structure predictors by one click
- SST(页面存档备份,存于互联网档案馆) webserver: An information-theoretic (compression-based) secondary structural assignment.