遗传密码

遗传密码

目录导航

基本内容

大自然将奥秘或法则隐匿于一套密码之中,藉此创作出数以千万计的物种,之后又将其销毁,终而复始,生生不息[2]

特点

方向性

遗传密码遗传密码密码子是对mRNA分子的碱基序列而言的,它的阅读方向是与mRNA的合成方向或mRNA编码方向一致的,即从5'端至3'端。

连续性

mRNA的读码方向从5'端至3'端方向,两个密码子之间无任何核苷酸隔开。mRNA链上碱基的插入、缺失和重叠,均造成框移突变。

遗传密码表遗传密码表

简并性

指一个氨基酸具有两个或两个以上的密码子。密码子的第三位碱基改变往往不影响氨基酸翻译。

摆动性

mRNA上的密码子与转移RNA(tRNA)J上的反密码子配对辨认时,大多数情况遵守碱基互补配对原则,但也可出现不严格配对,尤其是密码子的第三位碱基与反密码子的第一位碱基配对时常出现不严格碱基互补,这种现象称为摆动配对。

通用性

蛋白质生物合成的整套密码,从原核生物到人类都通用。但已发现少数例外,如动物细胞的线粒体、植物细胞的叶绿体。

破解历史

遗传密码遗传密码遗传密码的发现是20世纪50年代的一项奇妙想象和严密论证的伟大结晶。mRNA由四种含有不同碱基腺嘌呤(简称A)、尿嘧啶(简称U)、胞嘧啶(简称C)、鸟嘌呤(简称G)的核苷酸组成。最初科学家猜想,一个碱基决定一种氨基酸,那就只能决定四种氨基酸,显然不够决定生物体内的二十种氨基酸。那么二个碱基结合在一起,决定一个氨基酸,就可决定十六种氨基酸,显然还是不够。如果三个碱基组合在一起决定一个氨基酸,则有六十四种组合方式,看来三个碱基的三联体就可以满足二十种氨基酸的表示了,而且还有富余。猜想毕竟是猜想,还要严密论证才行。

自从发现了DNA的结构,科学家便开始致力研究有关制造蛋白质的秘密。伽莫夫(George Gamow)指出需要以三个核酸一组才能为20个氨基酸编码。1961年,美国国家卫生院的马太(Heinrich Matthaei)与尼伦伯格(Marshall Warren Nirenberg)在无细胞系统(Cell-free system)环境下,把一条只由尿嘧啶(U)组成的RNA转释成一条只有苯丙氨酸(Phe)的多肽,由此破解了首个密码子(UUU -> Phe)。随后科拉纳(Har Gobind Khorana)破解了其它密码子,接着霍利(Robett W.Holley)发现了负责转录过程的tRNA。1968年,科拉纳、霍利和尼伦伯格分享了诺贝尔生理学或医学奖。

阅读方式

遗传密码遗传密码破译遗传密码,必须了解阅读密码的方式。遗传密码的阅读,可能有两种方式:一种是重叠阅读,一种是非重叠阅读。例如mRNA上的碱基排列是AUGCUACCG。若非重叠阅读为AUG、CUA、CCG、;若重叠阅读为AUG、UGC、GCU、CUA、UAC、ACC、CCG。两种不同的阅读方式,会产生不同的氨基酸排列。克里克用T噬菌体为实验材料,研究基因的碱基增加或减少对其编码的蛋白质会有什么影响。克里克发现,在编码区增加或删除一个碱基,便无法产生正常功能的蛋白质;增加或删除两个碱基,也无法产生正常功能的蛋白质。但是当增加或删除三个碱基时,却合成了具有正常功能的蛋白质。这样克里克通过实验证明了遗传密码中三个碱基编码一个氨基酸,阅读密码的方式是从一个固定的起点开始,以非重叠的方式进行,编码之间没有分隔符。

验证猜想

遗传密码遗传密码1959年三联体密码的猜想终于被尼伦伯格(Nirenberg Marshall Warren)等人用“体外无细胞体系”的实验证实。尼伦伯格等人的实验用人工制成的只含一种核苷酸的mRNA作模板,提供核糖体、ATP、全套蛋白翻译所必需的酶系统和二十种氨基酸单体等等作为原料,在合适的条件下接着观察这已知的核苷酸组成的mRNA翻译出的多肽链。结果发现形成一条多个氨基酸组成的肽链。从而表明mRNA上的碱基决定氨基酸。此外实验同时也证明了mRNA上的密码是奇数的三联体,因为只有奇数的三联体才能形成交互的二个密码。

破译方法

尼伦伯格等发现由三个核苷酸构成的微mRNA能促进相应的氨基酸-tRNA和核糖体结合。但微mRNA不能合成多肽,因此不一定可靠。科兰纳(Khorana,Har Gobind)用已知组成的两个、三个或四个一组的核苷酸顺序人工合成mRNA,在细胞外的转译系统中加入放射性标记的氨基酸,然后分析合成的多肽中氨基酸的组成。

尼伦伯格(Nirenberg,Marshall Warren)尼伦伯格(Nirenberg,Marshall Warren)通过比较,找出实验中三联码相同的部分,再找出多肽中相同的氨基酸,于是可确定该三联码就为该氨基酸的遗传密码。科兰纳用此方法破译了全部遗传密码,从而和尼伦伯格分别获得1968年诺贝尔奖金。

后来,尼伦伯格等用多种不同的人工mRNA进行实验,观察所得多肽链上的氨基酸的类别,再用统计方法推算出人工mRNA中三联体密码出现的频率,分析与合成蛋白中各种氨基酸的频率之间的相关性,以此方法也能找出20种氨基酸的全部遗传密码。最后,科学家们还用了由3个核苷酸组成的各种多核苷链来检查相应的氨基酸,进一步证实了全部密码子。

破解原理

DNA分子是由四种核苷酸的多聚体。这四种核苷酸的不同之处在于所含碱基的不同,即A、T、C、G四种碱基的不同。用A、T、C、G分别代表四种核苷酸,则DNA分子中将含有四种密码符号。以一段DNA含有1000对核苷酸而言,这四种密码的排列就可以有41000种形式,理论上可以表达出无限信息。

遗传密码

遗传密码(geneticcode)又是如何翻译的呢?首先是以DNA的一条链为模板合成与它互补的mRNA,根据碱基互补配对原则在这条mRNA链上,A变为U,T变为A,C变为G,G变为C。因此,这条mRNA上的遗传密码与原来模板DNA的互补DNA链是一样的,所不同的只是U代替了T。然后再由mRNA上的遗传密码翻译成多肽链中的氨基酸序列。碱基与氨基酸两者之间的密码关系,显然不可能是1个碱基决定1个氨基酸。因此,一个碱基的密码子(codon)是不能成立的。如果是两个碱基决定1个氨基酸,那么两个碱基的密码子可能的组合将是42=16。这种比现存的20种氨基酸还差4种因此不敷应用。如果每三个碱基决定一个氨基酸,三联体密码可能的组合将是43=64种。这比20种氨基酸多出44种,所以会产生多余密码子。可以认为是由于每个特定的氨基酸是由1个或多个的三联体(triplet)密码决定的。一个氨基酸由一个以上的三联体密码子所决定的现象,称为简并(degeneracy)。

每种三联体密码决定什么氨基酸呢?从1961年开始,经过大量的实验,分别利用64个已知三联体密码,找出了与他们对应的氨基酸。1966-1967年,全部完成了这套遗传密码的字典。大多数氨基酸都有几个三联体密码,多则6个,少则2个,这就是上面提到过的简并现象。只有色氨酸与甲硫氨酸这两种氨基酸例外,只有1个三联体密码。此外,还有3个三联体密码UAA、UAG和UGA不编码任何氨基酸,它们是蛋白质合成的终止信号。三联体密码AUG在原核生物中编码甲酰化甲硫氨酸,在真核生物中编码甲硫氨酸,并起合成起点作用。GUG编码结氨酸,在某些生物中也兼有合成起点作用。分析简并现象时可以看到,当三联体密码的第一个、第二个碱基决定之后,有时不管第三个碱基是什么,都可能决定同一个氨基酸。例如,脯氨酸是由下列四个三联体密码决定的:CCU、CCC、CCA、CCG。也就是说,在一个三联体密码上,第一个,第二个碱基比第三个碱基更为重要,这就是产生简并现象的基础。

同义的密码子越多,生物遗传的稳定性越大。因为当DNA分子上的碱基发生变化时,突变后所形成的三联体密码,可能与原来的三联体密码翻译成同样的氨基酸,或者化学性质相近的氨基酸,在多肽链上就不会表现任何变异或者变化不明显。因而简并现象对生物遗传的稳定性具有重要意义。

历史起源

除了少数的不同之外,地球上已知生物的遗传密码均非常接近;因此根据演化论,遗传密码应在生命历史中很早期就出现。现有的证据表明遗传密码的设定并非是随机的结果,对此有以下的可能解释[2]

ATP在细胞中位于生化系统的中心ATP在细胞中位于生化系统的中心ATP中心假说示意图ATP中心假说示意图韦斯(Carl Richard Woese)认为,一些氨基酸与它们相对应的密码子有选择性的化学结合力(立体化学假说,stereochemical hypothesis),这显示现在复杂的蛋白质制造过程可能并非一早存在,最初的蛋白质可能是直接在核酸上形成。但王子晖(J. Tze-Fei Wong)认为,氨基酸和相应编码的忠实性反映了氨基酸生物合成路径的相似性,并非物理化学性质的相似性(共进化假说,co-evolution hypothesis)。谢平指出,遗传密码子是生化系统的一部分,因此,必须与生化系统的演化相关联,而生化系统的核心是ATP,只有它才能建立起核酸和蛋白质之间的联系(ATP中心假说,ATP-centric hypothesis):ATP(a)是光能转化成化学能的终端,(b)导演了一系列的生化循环(如卡尔文循环、糖酵解和三羧酸循环等)及元素重组,(c)它通过自身的转化与缩合将错综复杂的生命过程信息化——筛选出用4种碱基编码20多个氨基酸的三联体密码子系统、精巧地构建了一套遗传信息的保存、复制、转录和翻译以及多肽链的生产体系,(d)演绎出蛋白质与核酸互为因果的反馈体系,在个体生存的方向性筛选中,构筑了对细胞内成百上千种同步发生的生化反应进行秩序化管控(自组织)的复杂体系与规则,并最终建立起个性生命的同质化传递机制——遗传。因此,遗传密码子的起源是原始生命从能量转换到信息化的过程中实现的[3]

原始的遗传密码可能比今天简单得多,随着生命演化制造出新的氨基酸再被利用而令遗传密码变得复杂。虽然不少证据证明这一观点,但详细的演化过程仍在探索之中。经过自然选择,现时的遗传密码减低了突变造成的不良影响。Knight等认为,遗传密码是由选择(selection)、历史(history)和化学(chemistry)三个因素在不同阶段起作用的(综合进化假说)。

其它假说:艾根提出了试管选择(in vitro selection)假说,奥格尔(Leslie Eleazer Orgel)提出了解码(decoding)机理起源假说,杜维(Christian de Duve)提出了第二遗传密码(second genetic code)假说。Wu等推测,三联体密码从两种类型的双联体密码逐渐进化而来, 这两种双联体密码是按照三联体密码中固定的碱基位置来划分的, 包括前缀密码子(Prefix codons)和后缀密码子(Suffix codons)。不过,Baranov等推测三联体密码子是从更长的密码子(如四联体密码子quadruplet codons)演变而来,因为长的密码子具有更多的编码冗余从而能抵御更大的突变压力[2]

密码子表

此表列出了64种密码子以及氨基酸的标准配对[4]

1994年版曾邦哲著《结构论》中对密码子和氨基酸的组合数学计算公式为:C1/4+2C2/4+C3/4=20氨基酸,C1/4+6(C2/4+C3/4)=64密码子。

第 二 位 碱 基
- U C A G -
U UUU (Phe/F)苯丙氨酸UUC (Phe/F)苯丙氨酸UUA (Leu/L)亮氨酸UUG (Leu/L)亮氨酸 UCU (Ser/S)丝氨酸UCC (Ser/S)丝氨酸UCA (Ser/S)丝氨酸UCG (Ser/S)丝氨酸 UAU (Tyr/Y)酪氨酸UAC (Tyr/Y)酪氨酸UAA (终止)UAG (终止) UGU (Cys/C)半胱氨酸UGC (Cys/C)半胱氨酸UGA (终止)UGG (Trp/W)色氨酸 UCAG
C CUU (Leu/L)亮氨酸CUC (Leu/L)亮氨酸CUA (Leu/L)亮氨酸CUG (Leu/L)亮氨酸 CCU (Pro/P)脯氨酸CCC (Pro/P)脯氨酸CCA (Pro/P)脯氨酸CCG (Pro/P)脯氨酸 CAU (His/H)组氨酸CAC (His/H)组氨酸CAA (Gln/Q)谷氨酰胺CAG (Gln/Q)谷氨酰胺 CGU (Arg/R)精氨酸CGC (Arg/R)精氨酸CGA (Arg/R)精氨酸CGG (Arg/R)精氨酸 UCAG
A AUU (Ile/I)异亮氨酸AUC (Ile/I)异亮氨酸AUA (Ile/I)异亮氨酸AUG (Met/M)甲硫氨酸(起始) ACU (Thr/T)苏氨酸ACC (Thr/T)苏氨酸ACA (Thr/T)苏氨酸ACG (Thr/T)苏氨酸 AAU (Asn/N)天冬酰胺AAC (Asn/N)天冬酰胺AAA (Lys/K)赖氨酸AAG (Lys/K)赖氨酸 AGU (Ser/S)丝氨酸AGC (Ser/S)丝氨酸AGA (Arg/R)精氨酸AGG (Arg/R)精氨酸 UCAG
G GUU (Val/V)缬氨酸GUC (Val/V)缬氨酸GUA (Val/V)缬氨酸GUG (Val/V)缬氨酸 GCU (Ala/A)丙氨酸GCC (Ala/A)丙氨酸GCA (Ala/A)丙氨酸GCG (Ala/A)丙氨酸 GAU (Asp/D)天冬氨酸GAC (Asp/D)天冬氨酸GAA (Glu/E)谷氨酸GAG (Glu/E)谷氨酸 GGU (Gly/G)甘氨酸GGC (Gly/G)甘氨酸GGA (Gly/G)甘氨酸GGG (Gly/G)甘氨酸 UCAG

注:(起始)标准起始编码,同时为甲硫氨酸编码。mRNA中第一个AUG就是蛋白质翻译的起始部位。

逆密码子表

第 二 位 碱 基
- U C A G -
U UUU (Phe/F)苯丙氨酸UUC (Phe/F)苯丙氨酸UUA (Leu/L)亮氨酸UUG (Leu/L)亮氨酸 UCU (Ser/S)丝氨酸UCC (Ser/S)丝氨酸UCA (Ser/S)丝氨酸UCG (Ser/S)丝氨酸 UAU (Tyr/Y)酪氨酸UAC (Tyr/Y)酪氨酸UAA (终止)UAG (终止) UGU (Cys/C)半胱氨酸UGC (Cys/C)半胱氨酸UGA (终止)UGG (Trp/W)色氨酸 UCAG
C CUU (Leu/L)亮氨酸CUC (Leu/L)亮氨酸CUA (Leu/L)亮氨酸CUG (Leu/L)亮氨酸 CCU (Pro/P)脯氨酸CCC (Pro/P)脯氨酸CCA (Pro/P)脯氨酸CCG (Pro/P)脯氨酸 CAU (His/H)组氨酸CAC (His/H)组氨酸CAA (Gln/Q)谷氨酰胺CAG (Gln/Q)谷氨酰胺 CGU (Arg/R)精氨酸CGC (Arg/R)精氨酸CGA (Arg/R)精氨酸CGG (Arg/R)精氨酸 UCAG
A AUU (Ile/I)异亮氨酸AUC (Ile/I)异亮氨酸AUA (Ile/I)异亮氨酸AUG (Met/M)甲硫氨酸(起始) ACU (Thr/T)苏氨酸ACC (Thr/T)苏氨酸ACA (Thr/T)苏氨酸ACG (Thr/T)苏氨酸 AAU (Asn/N)天冬酰胺AAC (Asn/N)天冬酰胺AAA (Lys/K)赖氨酸AAG (Lys/K)赖氨酸 AGU (Ser/S)丝氨酸AGC (Ser/S)丝氨酸AGA (Arg/R)精氨酸AGG (Arg/R)精氨酸 UCAG
G GUU (Val/V)缬氨酸GUC (Val/V)缬氨酸GUA (Val/V)缬氨酸GUG (Val/V)缬氨酸 GCU (Ala/A)丙氨酸GCC (Ala/A)丙氨酸GCA (Ala/A)丙氨酸GCG (Ala/A)丙氨酸 GAU (Asp/D)天冬氨酸GAC (Asp/D)天冬氨酸GAA (Glu/E)谷氨酸GAG (Glu/E)谷氨酸 GGU (Gly/G)甘氨酸GGC (Gly/G)甘氨酸GGA (Gly/G)甘氨酸GGG (Gly/G)甘氨酸 UCAG

技术细节

此表列出了和20种氨基酸和密码子的标准配对。

Ala A GCU,GCC,GCA,GCG Leu L UUA,UUG,CUU,CUC,CUA,CUG
Arg R CGU,CGC,CGA,CGG,AGA,AGG Lys K AAA,AAG
Asn N AAU,AAC Met M AUG
Asp D GAU,GAC Phe F UUU,UUC
Cys C UGU,UGC Pro P CCU,CCC,CCA,CCG
Gln Q CAA,CAG Ser S UCU,UCC,UCA,UCG,AGU,AGC
Glu E GAA,GAG Thr T ACU,ACC,ACA,ACG
Gly G GGU,GGC,GGA,GGG Trp W UGG
His H CAU,CAC Tyr Y UAU,UAC
Ile I AUU,AUC,AUA Val V GUU,GUC,GUA,GUG
起始 AUG 终止 UAG,UGA,UAA

起始和终止密码子

Ala A GCU,GCC,GCA,GCG Leu L UUA,UUG,CUU,CUC,CUA,CUG
Arg R CGU,CGC,CGA,CGG,AGA,AGG Lys K AAA,AAG
Asn N AAU,AAC Met M AUG
Asp D GAU,GAC Phe F UUU,UUC
Cys C UGU,UGC Pro P CCU,CCC,CCA,CCG
Gln Q CAA,CAG Ser S UCU,UCC,UCA,UCG,AGU,AGC
Glu E GAA,GAG Thr T ACU,ACC,ACA,ACG
Gly G GGU,GGC,GGA,GGG Trp W UGG
His H CAU,CAC Tyr Y UAU,UAC
Ile I AUU,AUC,AUA Val V GUU,GUC,GUA,GUG
起始 AUG 终止 UAG,UGA,UAA

简并性

阅读框

遗传密码遗传密码蛋白质的转译从初始化密码子(起始密码子)开始,但亦需要适当的初始化序列和起始因子才能使mRNA和核糖体结合。最常见的起始密码子为AUG,其同时编码的氨基酸在细菌为甲酰甲硫氨酸,在真核生物为甲硫氨酸,但在个别情况其它一些密码子也具有起始的功能。

在经典遗传学中,终止密码子各有名称:UAG为琥珀(amber),UGA为蛋白石(opal),UAA为赭石(ochre)。这些名称来源于最初发现到这些终止密码子的基因的名称。终止密码子使核糖体和释放因子结合,使多肽从核糖体分离而结束转译的程序。另外,在哺乳动物的线粒体中,AGA和AGG也充当终止密码子。

非标准的遗传密码

大部分密码子具有简并性,即两个或者多个密码子编码同一氨基酸。简并的密码子通常只有第三位碱基不同,例如,GAA和GAG都编码谷氨酰胺。如果不管密码子的第三位为哪种核苷酸,都编码同一种氨基酸,则称之为四重简并;如果第三位有四种可能的核苷酸之中的两种,而且编码同一种氨基酸,则称之为二重简并,一般第三位上两种等价的核苷酸同为嘌呤(A/G)或者嘧啶(C/T)。只有两种氨基酸仅由一个密码子编码,一个是甲硫氨酸,由AUG编码,同时也是起始密码子;另一个是色氨酸,由UGG编码。 遗传密码的这些性质可使基因更加耐受点突变。例如,四重简并密码子可以容忍密码子第三位的任何变异;二重简并密码子使三分之一可能的第三位的变异不影响蛋白质序列。由于转换变异(嘌呤变为嘌呤或者嘧啶变为嘧啶)比颠换变异(嘌呤变为嘧啶或者嘧啶变为嘌呤)的可能性更大,因此二重简并密码子也具有很强的对抗突变的能力。不影响氨基酸序列的突变称为沉默突变。

三联体密码表以及tRNA的反密码子与mRNA的密码子的配对三联体密码表以及tRNA的反密码子与mRNA的密码子的配对简并性的出现是由于tRNA反密码子的第一位碱基可以和mRNA构成摆动碱基对,常见的情况为反密码子上的次黄嘌呤(I),以及和密码子形成非标准的U-G配对。

另一种有助对抗点突变的情况,是NUN (N代表任何核苷酸) 倾向于代表疏水性氨基酸,故此即使出现突变,仍有较大机会维持蛋白质的亲水度,减低致命破坏的可能。

结构基因的表达

“密码子”是由阅读的起始位点决定的。例如,一段序列GGGAAACCC,如果由第一个位置开始读,包括3个密码子GGG,AAA和CCC。如果从第二位开始读,包括GGA和AAC(忽略不完整的密码子)。如果从第三位开始读,则为GAA和ACC。故此每段序列都可以分为三个阅读框,每个都能产生不同的氨基酸序列(在上例中,相应为Gly-Lys-Pro,Gly-Asp,和Glu-Thr)。而因为DNA的双螺旋结构,每段DNA实际上有六个阅读框。实际的框架是由起始密码子确定,通常是mRNA序列上第一个出现的AUG。 破坏阅读框架的变异(例如,插入或删除1个或2个核苷酸)称为阅读框变异,通常会严重影响到蛋白质的功能,故此并不常见,因为他们通常不能在演化中存活下来。

一代密码

虽然遗传密码在不同生命之间有很强的一致性,但亦存在非标准的遗传密码。在有“细胞能量工厂”之称的线粒体中,便有和标准遗传密码数个相异的之处,甚至不同生物的线粒体有不同的遗传密码。支原体会把UGA转译为色氨酸。纤毛虫则把UAG(有时候还有UAA)转译为谷氨酰胺(一些绿藻也有同样现象),或把UGA转译为半胱氨酸。一些酵母会把GUG转译为丝氨酸。在一些罕见情况,一些蛋白质会有AUG以外的起始密码子。 真菌、原生生物和人以及其它动物的粒线体中的遗传密码与标准遗传密码的差异,主要变化如下:

密码子 通常的作用 例外的作用 所属的生物
UGA 中止编码 色氨酸编码 人、牛、酵母线粒体,支原体(Mycoplasma)基因组,如Capricolum
UGA 中止编码 半胱氨酸编码 一些纤毛虫(ciliate)细胞核基因组,如游纤虫属(Euplotes)
AGR 精氨酸编码 中止编码 大部分动物线粒体,脊椎动物线粒体
AGA 精氨酸编码 丝氨酸编码 果蝇线粒体
AUA 异亮氨酸编码 蛋氨酸编码 一些动物和酵母线粒体
UAA 中止编码 谷氨酰胺编码 草履虫、一些纤毛虫(ciliate)细胞核基因组,如嗜热四膜虫(ThermophAilus tetrahymena)
UAG 中止编码 谷氨酸编码 草履虫核细胞核基因组
GUG 缬氨酸编码 丝氨酸编码 假丝酵母核基因组
AAA 赖氨酸编码 天冬氨酸编码 一些动物的线粒体,果蝇线粒体
CUG 亮氨酸编码 中止编码 圆柱念珠菌(Candida cylindracea)细胞核基因组
CUN 亮氨酸编码 苏氨酸编码 酵母线粒体

按信使RNA的序列,在一些蛋白质里停止密码子会被翻译成非标准的氨基酸,例如UGA转译为硒半胱氨酸和UAG转译为吡咯赖氨酸,随着对基因组序列加深了解,科学家可能还会发现其它非标准的转译方式,以及其它未知氨基酸在生物中的应用。

二代密码

密码子 通常的作用 例外的作用 所属的生物
UGA 中止编码 色氨酸编码 人、牛、酵母线粒体,支原体(Mycoplasma)基因组,如Capricolum
UGA 中止编码 半胱氨酸编码 一些纤毛虫(ciliate)细胞核基因组,如游纤虫属(Euplotes)
AGR 精氨酸编码 中止编码 大部分动物线粒体,脊椎动物线粒体
AGA 精氨酸编码 丝氨酸编码 果蝇线粒体
AUA 异亮氨酸编码 蛋氨酸编码 一些动物和酵母线粒体
UAA 中止编码 谷氨酰胺编码 草履虫、一些纤毛虫(ciliate)细胞核基因组,如嗜热四膜虫(ThermophAilus tetrahymena)
UAG 中止编码 谷氨酸编码 草履虫核细胞核基因组
GUG 缬氨酸编码 丝氨酸编码 假丝酵母核基因组
AAA 赖氨酸编码 天冬氨酸编码 一些动物的线粒体,果蝇线粒体
CUG 亮氨酸编码 中止编码 圆柱念珠菌(Candida cylindracea)细胞核基因组
CUN 亮氨酸编码 苏氨酸编码 酵母线粒体

医学应用

DNADNA一个生物体携带的全套遗传信息,即基因组。具体化学分子是DNA线状分子。分子中每个有功能的单位被称作基因,每个基因均是由一连串单核苷酸组成。能编码蛋白质的基因称为结构基因。结构基因的表达是DNA分子通过转录反应生成线状核酸RNA分子,RNA分子在翻译系统的作用下翻译成蛋白质。

每个单核苷酸均由碱基,戊糖(即五碳糖,DNA中为脱氧核糖,RNA中为核糖)和磷酸三部分组成。碱基不同构成了不同的单核苷酸。组成DNA的碱基有腺嘌呤(A),鸟嘌呤(G),胞嘧啶(C)及胸腺嘧啶(T)。组成RNA的碱基以尿嘧啶(U)代替了胸腺嘧啶(T)。

三个单核苷酸形成一组密码子,而每个密码子代表一个氨基酸或终止信号。

在蛋白质合成的过程中,基因先被从DNA转录为对应的RNA模板,即信使RNA(mRNA)。接下来在核糖体和转移RNA(tRNA)以及一些酶的作用下,由该RNA模板转译成为氨基酸组成的链(多肽),然后经过翻译后修饰形成蛋白质。

因为密码子由三个核苷酸组成,故一共有43=64种密码子。例如,RNA序列UAGCAAUCC包含了三个密码子:UAG,CAA和UCC。这段RNA编码了代表了长度为3个氨基酸的一段蛋白质序列。(DNA也有类似的序列,但是以T代替了U)。

意义

遗传密码是由核苷酸组成的三联体。翻译时从起始密码子开始,沿着mRNA的5′——3′方向,不重叠地连续阅读氨基酸密码子,一直进行到终止密码子才停止,结果从N端到C端生成一条具有特定顺序的肽链。

“遗传密码”一词,现在被用来代表两种完全不同的含义,外行常用它来表示生物体内的全部遗传信息。分子生物学家指的是表示四个字母的核酸语言和20个字母的蛋白质语言之间关系的小字典。要了解核苷酸顺序是如何决定氨基酸顺序的,首先要知道编码的比例关系,即要弄清楚核苷酸数目与氨基酸数目的对应比例关系。

从数学观点考虑,核酸通常有四种核苷酸,而组成蛋白质的氨基酸有20种,因此,一种核苷酸作为一种氨基酸的密码是不可能的。如果两种核苷酸为一组,代表一种氨基酸,那么它们所能代表的氨基酸也只能有42=16种(不足20种)。如果三个核苷酸对应一个氨基酸,那么可能的密码子有43=64种,这是能够将20种氨基酸全部包括进去的最低比例。因此密码子是三联体(triplet),而不是二联体,(duplet),更不是单一体(singlet)。

国际公认的遗传密码,它是在1954年首先由盖莫夫提出具体设想,即四种不同的碱基怎样排列组合进行编码,才能表达出20种不同的氨基酸。1961年,由尼伦伯格等用大肠杆菌无细胞体系实验,发现苯丙氨酸的密码就是RNA上的尿嘧啶UUU密码子,到1966年,64种遗传密码全部破译。

在64个密码子中,一共有三个终止密码子,它们是UAA、UAG和UGA,不与tRNA结合,但能被释放因子识别。终止密码子也叫标点密码子或叫无意义密码子。有两个氨基酸密码子AUG和GUG同时兼作起密码子,它们作为体内蛋白质生物合成的起始信号,其中AUG使用最普遍。

密码的最终破译是由实验室而不是由理论得出的,遗传密码体现了分子生物学的核心,犹如元素周期表是化学的核心一样,但二者又有很大的差别。元素周期表很可能在宇宙中的任何地方都是正确的,特别是在温度和压力与地球都相似的条件下。但是如果在其他星球也有生命的存在,而那种生命也利用核酸和蛋白质,它们的密码很可能有巨的差异。在地球上,遗传密码只在某些生物中有微小的变异。克里克认为,遗传密码如同生命本身一样,并不是事物永恒的性质,至少在一定程度上,它是偶然的产物。当密码最初开始进化的,它很可能对生命的起源起重要作用。

词条图册

对生命遗传信息存储传递及表达的认识是20世纪生物学所取得的最重要的突破。其中的关键问题是由3个相连的核苷酸顺序决定蛋白质分子肽链中的1个氨基酸,即“三联遗传密码”(‘第一遗传密码“)的破译。但是蛋白质必须有特定的三维空间结构,才能表现其特定的生物功能。50年代Anfinsen提出假说,认为蛋白质特定的三维空间结构是由其氨基酸排列顺序所决定的,并因此获得诺贝尔奖.这一论断现在已被广泛接受,大量实验充分说明氨基酸

顺序与蛋白质空间结构之间确实存在着一定的关系。遗传信息的传递,应该是从核酸序列到功能蛋白质的全过程.现有的遗传密码仅有从核酸序列到无结构的多肽链的信息传递,因此是不完整的.本文讨论的是从无结构的多肽链到

有完整结构的功能蛋白质的信息传递部分。完整的提法应该是遗传密码的第二部分,即蛋白质中氨基酸序列与其空间结构的对应关系,国际上称之为第二遗传密码或折叠密码(以下简称第二密码)。Anfinsen原理认为,和一定的氨基酸序列相对应的空间结构是热力学上最稳定的结构,但多肽链折叠成为相应的空间结构在实际上还存在一个“这一过程是否能够在一定时间内完成”的动力学问题。事实上蛋白质最稳定结构与一些相似结构之间的能量差并不大,约在20.9~83.7kJ/mol左右。

蛋白质之所以最容易形成天然结构除能量因素外,是由动力学和熵的因素所决定的。近10余年来国际上在蛋白质天然结构形成的问题上发生了概念上的变革。过去曾经认为新生肽链能够自发地折叠成为完整的空间结构,分子伴侣的发现已经把过去经典的自发折叠概念转变为,有帮助的肽链的自发折叠和组装“的新概念”。“自发”是指由第二遗传密码决定折叠终态的“内因”亦即热力学因素,而“帮助”则是为保证该过程能高效完成的“外因”,是由一类新发现的分子伴侣蛋白和折叠酶来帮助完成的,主要是帮助克服动力学和熵的障碍,因而帮助克服细胞内由各种因素引起折叠错误并造成翻译后多肽链分子的聚集沉淀而最终导致信息传递中止。新生肽成熟为活性蛋白的过程中,不仅有折叠中间体与分子伴侣和折叠酶的相互作用,还有亚基间相互作用而组装成有功能的多亚基蛋白,以及错误折叠分子与特异蛋白水解酶的识别和作用以从细胞内清除构象错误的分子等。细胞内折叠过程也是一个蛋白分子内和分子间肽链相互作用的过程.细胞内新合成的多肽链浓度极高,这种“拥挤”状态会加剧蛋白分子间的错误相互作用而导致分子聚集。

相关百科
返回顶部
产品求购 求购