基因序列具有可检测性和遗传变异性

发布日期:2017-11-01

在漫长的进化过程中,生物在不断的环境压力下,通过改变自身的基因结构,发展并进化成为各种物种。在生物和环境这场艰巨的适者生存的战争中,发生的重要的遗传变化之一,是单核苷酸多态性,它存在于包括人类在内的所有有生命的生物中。如今,随着人类基因组计划的不断深入,已经识别出了人类基因组中的20000~25000个基因,导致了人类遗传变异相关的信息爆炸,并由此引发了后续工作的开展,如环境基因组计划、千人基因组计划在线数据库。

目前,其他多种在线工具,也成了我们可轻松访问的庞大数据资源,并满足正在开展的和 未来研究的项目的需求途径。SNP类型存在于DNA序列中,具有可检测性和可遗传变异性,它在形成单核苷酸的过程中(即A、T、C或G),可位于每个细胞的基因组序列中的任何地方。


因此,根据定义,一种给定的SNP会在不同个体或给定人群中,产生不同的基因型,更确切地说是三种基因型。种系突变也可能在生殖细胞受精后迅速发生,往往很罕见,最低等位基因频率(MAF)<1%,但往往会伴随已知的表型或疾病表现发生。

美国看病找爱诺美康,相对于种系突变来说,SNP则较为常见,在总人口中的发生率至少为1%。这种SNP形式的遗传突变,占所有人类遗传变异的大约90%,相当于30亿个碱基的人体基因组中每100~300个碱基就有一个SNP。基于基因组核苷酸中,发生变异的位置和功能相关性,为明确研究它们在疾病发生发展中的作用,我们将SNP分为几种类型。

科学有效的沟通,有助于在出版物中识别相同的SNP,当首次发现和向数据库报告以备SNP存档时,每个SNP都被赋予一个独一无二的SNP参考标识号。根据其在编码(包括非同义位点)和非编码区(或非转录区,UTR)的物理位置,SNP可分为编码和非编码SNP;基于DNA中的核苷酸的变化是否引起RNA密码子变化,进而导致蛋白质的氨基酸发生变化。

SNP被分为非同义和同义SNP;当基于其连锁不平衡(LD,至少r2>0.8),以及与其他SNP基因分型效率最大化时,SNP可分为标签和未标签SNP,但是SNP分型并不局限于此。举例来说,众所周知的SNP是人类P53肿瘤抑制基因的、一种编码或非同义SNP,因为它会在72号密码子(Arg72Pro)位置处造成G或C变异,导致氨基酸成为精氨酸(CGC)或脯氨酸(CCC)。但TP53的72号密码子SNP不是标签SNP,因为正如HapMap数据库指定的,以及SNPInfo的检测发现,它与在同一个基因中的其他SNP连锁不平衡。初步估计人类基因组中有超过1000万种SNP,有些常见,有些罕见。