单核苷酸多态性
单核苷酸多态性(英语:Single-Nucleotide Polymorphism,简称SNP,读作/snɪp/)是DNA序列中单个核苷酸的替代导致的、且分布于种群中相当一部分个体(如:1%以上)中的基因多样性。例如,对于某种生物,同一位置基因组片段一部分为AAGCCTA,另一部分为AAGCTTA,则认为此处存在SNP、两种基因型属于等位基因。
几乎所有常见的单核苷酸多态性(SNP)位点只有两个等位基因。单核苷酸态性(SNP)位点的分布是均匀的,在非编码区比在编码区更常见。一般来说,自然选择倾向于保留最益于遗传适应性的单核苷酸多态性(SNP)位点。[1]其他因素,如基因重组和突变率也可判断单核苷酸多态性(SNP)位点的密度。 [2]
单核苷酸多态性(SNP)的密度可以通过微卫星DNA进行预测。AT微卫星是单核苷酸多态性(SNP)密度有效的检测方式,在单核苷酸多态性(SNP)显著降低及较低GC含量的区域,AT出现大片重复。 [3]
在一个种群中,单核苷酸多态性(SNP)可以以次要等位基因频率的形式体现,即那些等位基因频率很低的基因座。单核苷酸多态性(SNP)等位基因的频率在不同人群中具有差异性,因此,常见于某地区或民族的单核苷酸多态性(SNP)等位基因在其他的地区或民族则可能很少见。
DNA指纹图谱是指个体间的遗传变异(尤其是在基因组的非编码区),常被用于法医学。同时,这些遗传变异也构成了人体对疾病易感性的差异,以及疾病的严重程度及治疗效果的差异。例如,载脂蛋白E(APOE)的单碱基突变与阿尔兹海默病发生低风险相关。[4]
人类遗传基因的各种差异,90%可归因于SNP引起的基因变异。在人类基因组中,每隔100至300个碱基就会存在一处SNP位点。每3个SNP位点中有2个会是胞嘧啶(C)和胸腺嘧啶(T)的相互转变。
类型
SNP类型 |
---|
|
单核苷酸多态性(SNP)根据其在基因中的位置,可以分为基因编码区、基因非编码区、基因间隔区(基因之间的区域)。由于基因序列的简并性,含有编码序列的单核苷酸多态性(SNP)不一定会改变蛋白质的氨基酸序列。
编码区的单核苷酸多态性(SNP)有两种类型:同义和非同义。同义单核苷酸多态性(SNP)并不影响蛋白质序列,而非同义单核苷酸多态性(SNP)则会改变蛋白质的氨基酸序列。
不在蛋白质编码区的单核苷酸多态性(SNP)仍可能影响基因剪接、转录因子结合、信使RNA降解或非编码区的RNA序列。受到这种单核苷酸多态性(SNP)影响的基因表达被称为单核苷酸多态性表达(ESNP),可能发生在此基因的上游或下游。
单核苷酸多态性(SNP)可能分布于编码基因段或非编码基因段。由于存在冗余基因序列,编码段中的单核苷酸多态性(SNP)不一定会影响蛋白质中的氨基酸序列。
利用及重要性
人类DNA序列的变化可以影响人类疾病的发展和对病原体、化学品、药品、疫苗等的机体反应。单核苷酸多态性(SNP)也是个性化医疗的关键。[5]然而,在生物医学中最重要的是在全基因组关联研究中比较同类基因组的不同区域。
单核苷酸多态性的研究在农作物和家畜育种项目中也很重要。识别单核苷酸多态性各种方法的详细信息,请参阅单核苷酸多态性基因分型。
单核苷酸多态性(SNP)通常是双等位基因,因此容易检测分析。[6]单个的单核苷酸多态性(SNP)可能导致孟德尔疾病。对于骨质疏松症这种更复杂的疾病,一个位点的单核苷酸多态性(SNP)通常不能单独起作用,而是与其他位点的单核苷酸多态性(SNP)相互作用而表现出病情。 [7]
截至2012年6月26日,单核苷酸多态性数据库(dbSNP)已列出人类的53,558,214个单核苷酸多态性(SNP)位点。 [8]单核苷酸多态性(SNP)位点已被用于全基因组关联研究(GWAS),例如,基因图谱中的高分辨率标记与疾病或正常的特征有关。单核苷酸多态性(SNP)的知识将有助于了解药物的代谢动力学(PK)或药效动力学,即在不同的遗传变异个体中药物是如何发挥作用的。单核苷酸多态性(SNP)可能会导致广泛的人类疾病,如癌症、传染性疾病(艾滋病,麻风病,肝炎等)、自体免疫性疾病、神经精神性疾病、镰状细胞贫血、β地中海贫血症及囊性纤维化等。[9][10][11]与不同单核苷酸多态性(SNP)相关的疾病将可能成为药物治疗的主要基因组目标。 [12]某些单核苷酸多态性(SNP)与不同药物的代谢有关。[13][14][15]因其世代中的数量及稳定遗传,对表型没有影响的单核苷酸多态性(SNP)在全基因组关联研究(GWAS)中也仍然有用。 [16]
举例
数据库
生物信息学数据库用于对单核苷酸多态性(SNP)相关研究的检索。单核苷酸多态性数据库(dbSNP)信息来自生物技术信息中心 (NCBI)。以下列出一些常用SNP相关的数据库:
数据库或工作组名称 | 主要特点 |
---|---|
SNPedia(页面存档备份,存于互联网档案馆) | 维基风格的数据库,可用于支持人类基因组注释,解释和分析 |
OMIM数据库(页面存档备份,存于互联网档案馆) | 描述多态性与疾病之间的关联(例如以文本形式给出疾病) |
人类基因突变数据库(页面存档备份,存于互联网档案馆) | 提供人类遗传性疾病和功能性单核苷酸多态性(SNP)的基因突变 |
全基因组关联分析中心(页面存档备份,存于互联网档案馆) | 允许用户查看目前单个或多个全基因组关联研究(GWAS)的大体水平 |
国际单核苷酸多态性(SNP)图谱工作组 | 通过校对嵌入的较大克隆体的基因组序列绘制出基因库中每个单核苷酸多态性(SNP)的周围序列[20] |
国际人类基因组单体图谱计划 | 在每个项目中研究能识别标记的单核苷酸多态性(SNP)用于确定单倍体的采集 |
命名
单核苷酸多态性(SNP)的命名可能容易混淆:单个的单核苷酸多态性(SNP)可能有几种表现形式,并且尚未达成共识。其中一种单核苷酸多态性(SNP)的书写形式是采用前缀,以及周期和“大于”符号来表示野生型和改变后的核苷酸或氨基酸,如c.76A>T。[21][22][23]如上文所示,通常采用核苷酸多态性数据库的rs号来表示。
单核苷酸多态性(SNP)分析
用于发现新SNP及检测已知SNP的分析方法包括:
单核苷酸多态性模拟及标签单核苷酸多态性 (tag SNP) 免费工具:
- GWAsimulator
- PLINK(模块)
标签单核苷酸多态性(SNP)表示基因组中具有高的连锁不平衡的区域中具有代表性的单核苷酸多态性(tag SNP)。它可以识别遗传变异和关联的表型基因分型,而无需在染色体区域每个单核苷酸多态性(SNP)进行基因分型,这减少了与疾病相关的基因组分型(genotyping)的费用和时间,因为它不需要研究每一个个体的单核苷酸多态性(SNP)。国际HapMap计划其中一个应用是由人类基因组图谱,获得标签SNP信息,从而减少了遗传研究的基因组分型的费用和时间。[27]
Tagger是一种可用于评估基因型数据和选择标签单核苷酸多态性 (tag SNP) 的工具,可用于如国际HapMap项目的资料。它是由保罗·德·巴克(Paul de Bakker)在马萨诸塞州医院(Massachusetts General Hospital)人类遗传研究中心和哈佛医学院Broad研究院的大卫阿特舒勒和马克 - 达利在中心(Labs of David Altshuler and Mark Daly)的实验室开发。[28]
CLUSTAG和WCLUSTAG是免费软件,包含集群和覆盖算法(cluster and set-cover algorithms)来获得一组标签单核苷酸多态性(tag SNP)位点,用来代表一个染色体区域所有已知的单核苷酸多态性(SNP)。该程序用Java实现,并且可以在Windows平台和Unix环境中运行。它们是由区小勇(SIO IONG AO)等人在香港大学开发的。[29][30]
参考文献
- ^ Barreiro LB, Laval G, Quach H, Patin E, Quintana-Murci L. (2008). "Natural selection has driven population differentiation in modern humans.". Nature Genetics 40: 340–345. doi:10.1038/ng.78. PMID 18246066.
- ^ Nachman, Michael W. (2001). "Single nucleotide polymorphisms and recombination rate in humans". Trends in genetics 17 (9):
- ^ M.A. Varela and W. Amos (2010). "Heterogeneous distribution of SNPs in the human genome: Microsatellites as predictors of nucleotide diversity and divergence".Genomics 95: 151–159. doi:10.1016/j.ygeno.2009.12.003. PMID 20026267.
- ^ Wolf, A. B.; Caselli, R. J.; Reiman, E. M.; Valla, J. (2012). "APOE and neuroenergetics: An emerging paradigm in Alzheimer's disease". Neurobiology of Aging.doi:10.1016/j.neurobiolaging.2012.10.011. PMID 23159550. edit
- ^ Carlson, Bruce (2008-06-15). "SNPs — A Shortcut to Personalized Medicine". Genetic Engineering & Biotechnology News (Mary Ann Liebert, Inc.) 28 (12). Retrieved 2008-07-06. "(subtitle) Medical applications are where the market's growth is expected"
- ^ Sachidanandam, Ravi; Weissman, David; Schmidt, Steven C.; Kakol, Jerzy M.; Stein, Lincoln D.; Marth, Gabor; Sherry, Steve; Mullikin, James C. et al. (2001). "A map of human genome sequence variation containing 1.42 million single nucleotide polymorphisms". Nature 409 (6822): 928–33. doi:10.1038/35057149. PMID 11237013.|displayauthors= suggested (help)
- ^ Singh, Monica; Singh, Puneetpal; Juneja, Pawan Kumar; Singh, Surinder; Kaur, Taranpal (2010). "SNP–SNP interactions within APOE gene influence plasma lipids in postmenopausal osteoporosis". Rheumatology International 31 (3): 421–3. doi:10.1007/s00296-010-1449-7. PMID 20340021.
- ^ 8. NCBI dbSNP build 137 for human.
- ^ Ingram, V. M. (1956). "A specific chemical difference between the globins of normal human and sickle-cell anaemia haemoglobin". Nature 178 (4537): 792–794.PMID 13369537. edit
- ^ Chang, J. C.; Kan, Y. W. (1979). "Beta 0 thalassemia, a nonsense mutation in man". Proceedings of the National Academy of Sciences of the United States of America76 (6): 2886–2889. PMC 383714. PMID 88735. edit
- ^ Hamosh, A.; King, T. M.; Rosenstein, B. J.; Corey, M.; Levison, H.; Durie, P.; Tsui, L. C.; McIntosh, I.; Keston, M.; Brock, D. J.; Macek, M.; Zemková, D.; Krásničanová, H.; Vávrová, V.; Macek, M.; Golder, N.; Schwarz, M. J.; Super, M.; Watson, E. K.; Williams, C.; Bush, A.; O'Mahoney, S. M.; Humphries, P.; Dearce, M. A.; Reis, A.; Bürger, J.; Stuhrmann, M.; Schmidtke, J.; Wulbrand, U.; Dörk, T. (1992). "Cystic fibrosis patients bearing both the common missense mutation Gly----Asp at codon 551 and the delta F508 mutation are clinically indistinguishable from delta F508 homozygotes, except for decreased risk of meconium ileus". American journal of human genetics 51 (2): 245–250. PMC 1682672. PMID 1379413. edit
- ^ Fareed, M., Afzal, M (2013) "Single nucleotide polymorphism in genome-wide association of human population: A tool for broad spectrum service". Egyptian Journal of Medical Human Genetics 14: 123–134. http://dx.doi.org/10.1016/j.ejmhg.2012.08.001 (页面存档备份,存于互联网档案馆).
- ^ Goldstein, J. A. (2001). "Clinical relevance of genetic polymorphisms in the human CYP2C subfamily". British journal of clinical pharmacology 52 (4): 349–355.doi:10.1046/j.0306-5251.2001.01499.x. PMC 2014584. PMID 11678778. edit
- ^ Lee, C. R. (2004). "CYP2C9 genotype as a predictor of drug disposition in humans". Methods and findings in experimental and clinical pharmacology 26 (6): 463–472.PMID 15349140. edit
- ^ Yanase, K.; Tsukahara, S.; Mitsuhashi, J.; Sugimoto, Y. (2006). "Functional SNPs of the breast cancer resistance protein ‐ therapeutic effects and inhibitor development". Cancer Letters 234 (1): 73–80. doi:10.1016/j.canlet.2005.04.039. PMID 16303243. edit
- ^ Thomas, P. E.; Klinger, R.; Furlong, L. I.; Hofmann-Apitius, M.; Friedrich, C. M. (2011). "Challenges in the association of human single nucleotide polymorphism mentions with unique database identifiers". BMC Bioinformatics 12: S4. doi:10.1186/1471-2105-12-S4-S4. PMC 3194196. PMID 21992066. edit
- ^ Morita, Akihiko; Nakayama, Tomohiro; Doba, Nobutaka; Hinohara, Shigeaki; Mizutani, Tomohiko; Soma, Masayoshi (2007). "Genotyping of triallelic SNPs using TaqMan PCR". Molecular and Cellular Probes 21 (3): 171–6. doi:10.1016/j.mcp.2006.10.005. PMID 17161935.
- ^ Prodi, D.A.; Drayna, D; Forabosco, P; Palmas, MA; Maestrale, GB; Piras, D; Pirastu, M; Angius, A (2004). "Bitter Taste Study in a Sardinian Genetic Isolate Supports the Association of Phenylthiocarbamide Sensitivity to the TAS2R38 Bitter Receptor Gene". Chemical Senses 29 (8): 697–702. doi:10.1093/chemse/bjh074.PMID 15466815.
- ^ Ammitzbøll, Christian Gytz (28). "Non-Synonymous Polymorphisms in the FCN1 Gene Determine Ligand-Binding Ability and Serum Levels of M-Ficolin". PLoS ONE 7 (11): e50585. doi:10.1371/journal.pone.0050585.
- ^ Sachidanandam, R.; Weissman, D.; Schmidt, S. C.; Kakol, J. M.; Stein, L. D.; Marth, G.; Sherry, S.; Mullikin, J. C.; Mortimore, B. J.; Willey, D. L.; Hunt, S. E.; Cole, C. G.; Coggill, P. C.; Rice, C. M.; Ning, Z.; Rogers, J.; Bentley, D. R.; Kwok, P. Y.; Mardis, E. R.; Yeh, R. T.; Schultz, B.; Cook, L.; Davenport, R.; Dante, M.; Fulton, L.; Hillier, L.; Waterston, R. H.; McPherson, J. D.; Gilman, B.; Schaffner, S. (2001). "A map of human genome sequence variation containing 1.42 million single nucleotide polymorphisms". Nature 409 (6822): 928–933. doi:10.1038/35057149. PMID 11237013. edit
- ^ J.T. Den Dunnen (2008-02-20). "Recommendations for the description of sequence variants". Human Genome Variation Society. Retrieved 2008-09-05.
- ^ den Dunnen, Johan T.; Antonarakis, Stylianos E. (2000). "Mutation nomenclature extensions and suggestions to describe complex mutations: A discussion". Human Mutation 15 (1): 7–12. doi:10.1002/(SICI)1098-1004(200001)15:1<7::AID-HUMU4>3.0.CO;2-N. PMID 10612815.
- ^ 23. Ogino, Shuji; Gulley, Margaret L.; Den Dunnen, Johan T.; Wilson, Robert B.; Association for Molecular Pathology Training and Education Committee (2007). "Standard Mutation Nomenclature in Molecular DiagnosticsPractical and Educational Challenges". The Journal of Molecular Diagnostics 9 (1): 1–6.doi:10.2353/jmoldx.2007.060081. PMC 1867422. PMID 17251329.
- ^ Altshuler, D; Pollara, V J; Cowles, C R; Van Etten, W J; Baldwin, J; Linton, L; Lander, E S. An SNP map of the human genome generated by reduced representation shotgun sequencing. Nature. 2000, 407 (6803): 513–6. PMID 11029002. doi:10.1038/35035083.
- ^ Drabovich, A.P.; Krylov, S.N. Identification of base pairs in single-nucleotide polymorphisms by MutS protein-mediated capillary electrophoresis. Analytical chemistry. 2006, 78 (6): 2035–8. PMID 16536443. doi:10.1021/ac0520386.
- ^ Griffin, T J; Smith, L M. Genetic identification by mass spectrometric analysis of single-nucleotide polymorphisms: ternary encoding of genotypes. Analytical chemistry. 2000, 72 (14): 3298–302. PMID 10939403. doi:10.1021/ac991390e.
- ^ Bush, William S.; Moore, Jason H.; Lewitter, Fran; Kann, Maricel (27 December 2012). "Chapter 11: Genome-Wide Association Studies". PLoS Computational Biology 8 (12): e1002822. doi:10.1371/journal.pcbi.1002822.
- ^ Tagger. [1 May 2014]. (原始内容存档于2016-08-23).
- ^ CLUSTAG. [9 March 2024]. (原始内容存档于2020-10-17).
- ^ WCLUSTAG. [9 March 2024]. (原始内容存档于2020-10-17).