蛋白質資料庫

蛋白質資料庫Protein Data Bank,簡稱PDB)是一個專門收錄蛋白質核酸三維結構資料的數據庫。由Worldwide Protein Data Bank監管。PDB可以經由網絡免費訪問,是結構生物學研究中的重要資源。為了確保PDB資料的完備與權威,各個主要的科學雜誌、基金組織會要求科學家將自己的研究成果提交給PDB。在PDB的基礎上,還發展出來若干依據不同原則對PDB結構數據進行分類的資料庫,例如GO將PDB中的數據按基因進行了分類。這些資料和數據一般是世界各地的結構生物學家經由X射線晶體學NMR光譜學實驗所得,並釋放到公有領域供公眾免費使用。

蛋白質資料庫
內容
相關信息
訪問入口
數據格式PDB
網站
工具
其他

歷史

PDB的歷史可以追溯到1971年,當時布魯克黑文國家實驗室的Walter Hamilton決定在Brookhaven建立這個資料庫。1973年Hamilton去世後,Tom Koeztle接管了PDB。1994年1月,以色列魏茨曼科學研究學院的Joel Sussman被任命為PDB負責人。在1998年10月,PDB被移交給了Research Collaboratory for Structural Bioinformatics(RCSB),並與1999年6月移交完畢,新的負責人是羅格斯大學(Rutgers大學)(RCSB成員)的Helen M. Berman。2003年,PDB作為wwPDB的核心,成為了一個國際性組織。同時,wwPDB的其他成員,包括PDBe(歐洲)、RCSB(美國)、PDBj(日本)也為PDB提供了數據積累、處理和發布的中心。BMRB英語Biological Magnetic Resonance Data Bank 於2006年加入[1]。值得一提的是,雖然PDB的數據是由世界各地的科學家提交的,但每條提交的數據都會經過wwPDB工作人員的審核與註解,並檢驗數據是否合理。PDB及其提供的軟體現在對公眾免費開放。

內容

 
蛋白質資料庫(PDB)中蛋白質結構的一些例子。
 
按方法和年份確定蛋白質結構的速率

PDB資料庫每週更新(UTC+0 星期三)。 同樣,PDB館藏列表[2]也每週更新一次。 截至截至2017年3月14日 (2017-03-14),現有統計信息如下:

實驗
方法
蛋白質 核酸 蛋白質/核酸
複合物
其他 總數
X射線晶體學 106595 1820 5471 4 113890
核磁共振 10296 1190 241 8 11735
電子顯微鏡 1021 30 367 0 1418
混合 99 3 2 1 105
其他 181 4 6 13 204
總數: 118192 3047 6087 26 127352
PDB中的103,514個結構具有結構因子文件。
9,057個結構具有NMR約束文件。
PDB中的2,826個結構具有化學位移文件。
PDB中的1,403個結構在EM Data Bank中存有3DEM地圖文件

這些數據表明大多數結構是由X射線衍射確定的,但是現在約10%的結構由蛋白質NMR確定。 當使用X射線衍射時,獲得蛋白質原子坐標的近似值,而通過NMR實驗發現蛋白質原子對之間距離的估計值。 因此,在後一種情況下,通過求解距離幾何問題英語Distance geometry problem來獲得蛋白質的最終構象。 一些蛋白質由低溫電子顯微鏡確定。 (單擊原始表中的數字將顯示由該方法確定的結構示例。)

上述結構因子文件的意義在於,對於具有結構文件的由X射線衍射確定的PDB結構,可以查看電子密度圖。 這些結構的數據存儲在「電子密度服務器」上[3][4]

過去,PDB的結構數量以近似指數的速度增長,通過了1982年的100個註冊結構里程碑,1993年的1,000個,1999年的10,000個,以及2014年的100,000個[5][6]。然而,自2007年以來,新蛋白質結構的積累速率似乎已經趨於穩定。

以下為PDB成員網站

參見

參考文獻

  1. ^ BMRB - Biological Magnetic Resonance Bank. [2014-01-02]. (原始內容存檔於2020-10-20). 
  2. ^ PDB Current Holdings Breakdown. RCSB. [2018-04-22]. (原始內容存檔於2007-07-04). 
  3. ^ The Uppsala Electron Density Server. Uppsala University. [2013-04-06]. (原始內容存檔於2021-03-21). 
  4. ^ Kleywegt GJ, Harris MR, Zou JY, Taylor TC, Wählby A, Jones TA. The Uppsala Electron-Density Server. Acta Crystallogr D. Dec 2004, 60 (Pt 12 Pt 1): 2240–2249. PMID 15572777. doi:10.1107/S0907444904013253. 
  5. ^ Anon. Hard data: It has been no small feat for the Protein Data Bank to stay relevant for 100,000 structures. Nature. 2014, 509 (7500): 260. PMID 24834514. doi:10.1038/509260a. 
  6. ^ Content Growth Report. RCSB PDB. [2013-04-06]. (原始內容存檔於2007-04-28). 

外部連結