DNA
DNA序列(8)DNA即脱氧核糖核酸(英文Deoxyribonucleic acid的缩写),又称去氧核糖核苷酸,是染色体主要组成成分,同时也是主要遗传物质。DNA分子是以4种脱氧核苷酸为单位连接而成的长链,这4种脱氧核苷酸分别含有A,T,C,G四种碱基。腺嘌呤(缩写作A)、胸腺嘧啶(缩写作T)、胞嘧啶(缩写作C)、鸟嘌呤(缩写作G)。
基因
基因(遗传因子)是具有遗传效应的DNA片段(部分病毒如烟草花叶病毒、HIV的遗传物质是RNA)。基因支持着生命的基本构造和性能。储存着生命的种族、血型、孕育、生长、凋亡等过程的全部信息。环境和遗传的互相依赖,演绎着生命的繁衍、细胞分裂和蛋白质合成等重要生理过程。生物体的生、长、衰、病、老、死等一切生命现象都与基因有关。它也是决定生命健康的内在因素。因此,基因具有双重属性:物质性(存在方式)和信息性(根本属性)。
DNA序列
带有遗传讯息的DNA片段称为基因,其他的DNA序列,有些直接以自身构造发挥作用,有些则参与调控遗传讯息的表现。组成简单生命最少要265到350个基因。(这涉及到了基因工作组的力量,人类的基因工作组与果蝇的基本相似)
DNA序列或 基因序列使用一串 字母表示的真实的或者假设的携带 基因信息的DNA分子的一级结构。
可能的字母只有A,C,G和T,分别代表组成DNA的四种核苷酸—— 腺嘌呤, 胞嘧啶, 鸟嘌呤, 胸腺嘧啶。每个字母代表一种碱基,两个碱基形成一个碱基对,碱基对的配对规律是固定的,即是:A-T,C-G。典型的他们无间隔的排列在一起,例如序列AAAGTCTGAC。任意长度大于4的一串 核苷酸被称做一个序列。关于它的生物功能,则依赖于上下文的序列,一个序列可能被正读,反读;包含编码或者无编码。DNA序列也可能包含"junk DNA"。
基因测序是一种新型基因检测技术,能够从血液或唾液中分析测定基因全序列,预测罹患多种疾病的可能性,如癌症或白血病。[1]
生命的奥秘,或者说遗传的信息,就隐藏在DNA的序列中。DNA是一种很长很大的分子,它是由四种脱氧核苷酸链接而成的,这四种脱氧核苷酸分别简称A、T、G、C。这四种脱氧核苷酸的排列组合,就构成了DNA序列,所谓测序,就是要知道某一段DNA上的核苷酸是怎么排列的。
2013年11月19日,英国著名生物化学家弗雷德里克·桑格在睡梦中去世,享年95岁。在学生物出身的人当中,桑格是一个尽人皆知的传奇式人物。他一个人解决了现代生物学的两大实际难题:怎么测定蛋白质的序列和怎么测定DNA(脱氧核糖核酸)的序列。因此他两次获得诺贝尔奖。1955年,桑格测定了第一种蛋白质(牛胰岛素)的序列和结构,3年后因此获得诺贝尔化学奖。1977年,桑格发明了一种快速测定DNA序列的巧妙方法,3年后再次获得诺贝尔化学奖。桑格发明的DNA测序方法很快成为各个分子生物学实验室的常规方法,成为最常用的测序方法达20多年之久(人类基因组序列就是用这种方法测定的),一直到现在,在小规模的DNA测序中还在使用。
我这一代的研究生,是要自己动手测序,掌握手工测序技术是基本功,跑出一个漂亮的“测序胶”,是一项技术活。测序也是分子生物学实验中最有意思的部分,所以现在的学生不再自己测序,真是失去了不少乐趣。实验第二天,取出测序胶辐射感光的底片,对着灯光依次读出底片上一条条黑带,一一记录下来:A、T、G、C……就仿佛又亲手破译了一小段生命的奥秘。
生命的奥秘,或者说遗传的信息,就隐藏在DNA的序列中。DNA是一种很长很大的分子,它是由四种脱氧核苷酸链接而成的,这四种脱氧核苷酸分别简称A、T、G、C。这四种脱氧核苷酸的排列组合,就构成了DNA序列,所谓测序,就是要知道某一段DNA上的核苷酸是怎么排列的。然后分别以这两条单链为模板,根据互补的原则,合成出另一条链。这个复制过程,需要三样的东西,一样是三种脱氧核苷酸作为原料,一样是能把脱氧核苷酸链接起来的DNA聚合酶,但这种酶不能从头开始复制,需要前面已经有了一小段和模板结合的DNA作为复制的起点(叫做引物),然后才能往上加新的脱氧核苷酸,所以最后一样需要的东西是引物(在细胞中,引物是由不需要引物的另一种DNA聚合酶合成的)。
桑格就是巧妙地利用了DNA复制机理来测定序列的。桑格的巧妙之处在于,除了上述三样东西,他给增添了一样东西:四种双脱氧核苷酸,它们在脱氧核苷酸A、T、G、C的基础上又少了一个氧原子(分别标记为ddA、ddT、ddG、ddC),它们能够根据互补的原则加到DNA链上,但是由于少了一个氧原子,没法再加核苷酸了,所以复制就到此为止。
好了,现在可以开始测序了。把要测序的DNA样品分成四份,每一份都加上A、T、G、C、DNA聚合酶和引物(实验用的引物是用化学方法合成的一小段DNA作为复制的起点,要合成它需要知道它有什么样的序列。你可能会奇怪,还没测序呢,怎么知道引物的序列?这是因为要测序的DNA是用分子克隆技术插进载体DNA中的,载体DNA的序列是已知的,可以根据载体DNA序列设计引物,最后测序的结果实际上是前面有一段载体DNA序列,后面才是我们要的DNA序列)。再给每一份样品分别加上一种双脱氧核苷酸,例如第一份加ddA,第二份加ddT,第三份加ddG,第四份加ddC。然后在一定条件下让它们开始复制DNA。我们假定DNA模板的第一个核苷酸是T,复制时与它互补的应该是A,在第一份样品中有ddA,如果跟T互补的是ddA,那么这条链的复制就终止,得到的是最小的一个片段;如果结合上去的是A,复制就继续下去,直到又碰到一个T,再次出现是ddA还是A的选择……依次类推,在第一份样品中,复制的结果得到的是一条条以ddA为终端的不同长度的DNA链,第二份以ddT为终端,第三份以ddG为终端,第四份以ddC为终端。把四份样品中的新DNA链综合起来看,就是一条条长短不一的DNA片段,每个不同片段的长度只差一个核苷酸,那么,如果能把这些DNA片段从短到长依次排列,看它们最后一个核苷酸是什么样的,依次记下来,不就是我们想要的DNA序列了吗?
这时候就需要跑“测序胶”了。把四份样品并排加到凝胶中,通上电。DNA分子带负电,在电场的作用下,在凝胶中DNA片段向正极方向跑,短的DNA片段跑得快,长的DNA片段跑得慢,这样,不同长度的DNA片段就可以在凝胶中一一分开,处于不同的位置上。然后把凝胶烘干,覆盖上底片。为了能看出DNA片段所在的位置,实验用的核苷酸是用放射性同位素做了标记的,它们能够发出射线让底片感光。第二天,取出底片冲洗,可以看到上面有一条条小小的黑带表示不同DNA片段所在的位置……这就是我们想知道的DNA序列。
基因测序技术能锁定个人病变基因,提前预防和治疗。
自上世纪90年代初,学界开始涉足“人类基因组计划”。而传统的测序方式是利用光学测序技术。用不同颜色的荧光标记四种不同的基因,然后用激光光源去捕捉荧光信号从而获得待测基因的序列信息。
虽然这种方法检测可靠,但是价格不菲也是有目共睹的,一台仪器的价格大约在50万到75万美元,而检测一次的费用也高达5千到1万美元。
最新的基因测序仪中,芯片代替了传统激光镜头、荧光染色剂等,芯片就是测序仪。
通过半导体感应器,仪器对DNA复制时产生的离子流实现直接检测。当试剂通过集成的流体通路进入芯片中,密布于芯片上的反应孔立即成为上百万个微反应体系。
这种技术组合,使研究人员能够在短短2小时内获取基因信息。而使用传统的光学测序技术需等待数周乃至数月后才能得到结果。同时,检测一次的费用也降到了最低1千美元。[2]