DSSP 是用于對蛋白質(zhì)結構中的氨基酸殘基進(jìn)行二級結構構像分類(lèi)的標準化算法,由Wolfgang Kabsch和Chris Sander設計。

簡(jiǎn)介

DSSP數據庫是由此算法生成的一個(gè)存放蛋白質(zhì)二級結構分類(lèi)數據的數據庫,其中包括了PDB數據庫(Protein Data Bank)中的所有條目。算法名稱(chēng)Define Secondary Structure of Proteins由作者在其原始論文中,作為實(shí)現該算法的Pascal語(yǔ)言程序名稱(chēng)所提及。DSSP數據庫英文全稱(chēng)則為Definition of Secondary Structure of Proteins。

算法原理

DSSP算法使用PDB格式的原子級分辨率的蛋白質(zhì)三維結構坐標集數據,依靠以靜電學(xué)定義進(jìn)行的氫鍵識別,以及對主鏈和側鏈二面角的計算,從而得到每個(gè)氨基酸殘基的二級結構構象參數。算法使用的鍵能公式為:

E=q1q2{1/rON+1/rCH-1/rOH-1/rCN}·332 kcal/mol

其中q1=0.42,q2=0.20。以上參數來(lái)自分別為-0.42e和+0.20e的羰基氧原子和氨基氫原子間的局部電荷、以及羰基碳原子和氨基氮原子間的互斥電荷。當鍵能小于-0.5 kcal/mol時(shí),DSSP算法將其定義為一個(gè)氫鍵。DSSP根據氫鍵模式,可以識別八種類(lèi)型的二級結構構像,各構像擁有各自的標識符。這八種構像為:310螺旋,α-螺旋,π-螺旋三種螺旋,分別以G、H和I標識,它們的識別特征是殘基與主鏈中分別3、4、5個(gè)后續殘基間形成氫鍵并產(chǎn)生重復序列;兩種β-折疊片中的氫鍵對類(lèi)型,平行與反向平行橋中,單獨的橋結構標識為B,即β-橋,含有β-凸起的折疊片標識為E;在其余構像種,包含即具有螺旋典型特征,連接螺旋與折疊結構的轉角區域表示為T(mén),具有高曲率,即從第i個(gè)主鏈α碳原子指向第i+2個(gè)的向量與從第i-2個(gè)α碳原子指向第i個(gè)的向量間夾角小于70°的區域標識為S,這也是程序中唯一不依靠氫鍵分類(lèi)的構像,剩余的環(huán)狀區域標識為L(cháng)。

這八種構像在實(shí)用中又常被歸為三個(gè)大類(lèi):螺旋(G、H和I)、折疊(E和B)以及環(huán)狀結構(其余所有標識符)。