• 30阅读
  • 0回复

什么是合成蛋白质的“密码”? [复制链接]

上一主题 下一主题
离线admin
 

只看楼主 倒序阅读 0 发表于: 1962-07-05
第5版()
专栏:

什么是合成蛋白质的“密码”?
谈家桢
据新华社报道,外国科学家研究生物体中用来决定蛋白质生物合成的“密码”问题已有成果(人民日报1962年6月14日)。国外电讯也报道了美国科学家谈蛋白质“密码”发现经过的新闻。究竟什么是合成蛋白质的“密码”,已引起了广泛的兴趣和议论。关于这个问题,我在1959年7月24日人民日报上曾发表过《遗传的分子基础和生物学的任务》一文,有所阐明。但时隔三年,这方面的研究工作在国际上又有了新的重大的进展。这一问题的研究,正如前苏联科学院院长涅斯米扬诺夫院士所说:“是现代科学的一项战略任务”,它是“位于化学、物理学、生物化学、生物学和控制论的接触面上的综合性问题”。现在,对这方面的工作作一个扼要而尽可能通俗的介绍。
问题的提出
蛋白质在生物体内的合成问题一直是个难题。为什么一种生物体内只能合成某些蛋白质而不能合成另一些蛋白质则更是一个难题。它与碳水化合物、脂肪及各种小分子的合成有根本的区别。
首先明确地提出“密码”问题的,是有名的理论物理学家盖莫夫(Gamow,1954)。他根据那时遗传学上已证明蛋白质分子的专一性决定于DNA(脱氧核糖核酸)分子的专一性的资料,根据瓦特森和克里克(Watson和Crick,1953)研究出的DNA分子结构模型,DNA分子专一性取决于其中四种核苷酸排列次序的专定性,根据桑格尔(Sanger,1954)第一次测定一种蛋白质(胰岛素)肽链中氨基酸次序而证明蛋白质专一性取决于氨基酸次序专定性的资料,提出:
可以把DNA看作一种“文字”,其中只有四个字母(即四种核苷酸,写成1、2、3、4);蛋白质也是一种“文字”,其中有二十个字母(即二十种氨基酸,写成a、b、c、d……)。蛋白质合成中的根本问题,就是DNA文字如何“翻译”成为蛋白质文字。好比我们在翻译电报密码时,把“·”、“——”、“一空格”、“二空格”等符号译成“0、1、2、3……”等符号一样。
蛋白质中氨基酸种类其实比二十略为多些,但乌塞司(Yěas,1958)根据生化资料论证:基本的只有二十种,其余几种不过是这基本的二十个“字母”加一些“变音符号”而已,譬如德文中的?,而打字机上是只有二十个字母的。这二十个“字母”是:
(1)丙氨酸 (2)精氨酸
(3)天冬氨酸 (4)天冬酰氨
(5)半胱氨酸 (6)谷氨酸
(7)谷氨酰氨 (8)甘氨酸
(9)组氨酸 (10)异亮氨酸
(11)亮氨酸 (12)赖氨酸
(13)甲硫氨酸 (14)苯丙氨酸
(15)脯氨酸 (16)丝氨酸
(17)苏氨酸 (18)色氨酸
(19)酪氨酸 (20)缬氨酸
盖莫夫(1954)最初提出在密码翻译时三个核苷酸“决定”(即“译成”)一个氨基酸,因为二个核苷酸只能有42=16种排列,最多只能相当于16种氨基酸,三个核苷酸能有43=64种排列,刚好是二十种组合,即:
111 112 223 334 123
222 113 224 441 124
333 114 331 442 134
444 221 332 443 234
所以他认为这种“三字经”密码有“简并”(Degeneration),即112、121、211三种都是同一“意义”(决定同一个氨基酸)。由于二十这个数字刚好巧合,所以盖莫夫甚为得意,他把“20”称为“生物学上的神奇数字”——在原子物理与原子核物理上,2×2n=2,8,16,32……等都称为“神奇数字”。
密码传递的物质基础
人们不久就确知蛋白质并不是在细胞核内染色体上DNA附近合成,而是在细胞质内微粒体颗粒上合成。以后又知道有二十种分子量较小的RNA(即所谓可溶性核糖核酸,简称sRNA)。每种各带一定的氨基酸,在微粒体颗粒附近排队,一个个氨基酸排成一串,联成一个多肽链,以后就成为蛋白质。最后又知道其排队时的次序决定于微粒体颗粒中一部分RNA(所谓信息RNA)分子中四种核苷酸的排列次序,而这种信息RNA是从细胞核内染色体上DNA附近合成后,从核进入细胞质的。染色体上DNA分子中核苷酸次序决定信息RNA分子中核苷酸次序,后者又进一步决定多肽链中氨基酸次序。所以密码问题就成为信息RNA中四种核苷酸的次序如何决定多肽链中氨基酸次序的问题。RNA的四种核苷酸一般简写为A、U、C、G。
几个原则问题
自从盖莫夫首次提出他的密码之后,有许多人对这问题发表了意见,其中最重要的是英国剑桥大学的物理学家克里克等(1957)所提出的一个问题:密码翻译时如何保证不读“破句”?因为信息RNA是长长的一条“多核苷酸链”,sRNA把氨基酸一个个接上去时,如果读了破句,那就不能保证专性蛋白质的正确合成。用我们的《三字经》作一个譬喻,设信息RNA为如下的一段:
“……初性本善性相近习相……”其中每个字相当于一个核苷酸。应当是“性本善”成一句(译成一个氨基酸),“性相近”又是一句,依此类推。但如果读了破句,以“初性本”为一句,那就势必译成另一种氨基酸,“善性相”又是另一种氨基酸……如此合成一个多肽链,岂不与正确的多肽链完全不同?而盖莫夫密码不能保证不读破句。所以克里克等提出一个所谓“不需标点的密码”,就是说:有许多三字句是“没有意义的胡说”。如果说“性本善”这样的句子有意义(有相应的氨基酸),则“初性本”这种句子就是“胡说”(没有相应的氨基酸)。所以他们认为像111这种三字句必是胡说,因为如果两个这样的三字句在一起,成为111111,则sRNA就不能断定把标点点在哪里。如果以121为有意义,则21开头的(如211,212…)就都是胡说,以12结尾的(112、312…)也都是胡说。把这些胡说排除之后,能有多少有意义的三字句呢?刚好也是二十个:
121 231 143 244
122 232 144 341
131 233 241 342
132 141 242 343
133 142 243 344
如果信息RNA全由这种三字句组成,那就可以保证不读破句。
这从信息论上的术语来讲叫做“约束”,就是说有些排列是被排除掉的。盖莫夫的密码有简并而无约束,克里克的密码有约束而无简并。乌塞司(1958)认为不必有如此的约束,只要总是从头读起,机械地三字一句,就不读破句。
此外,也有人根据遗传学和生物化学在当时的一些初步资料,认为应当是四字句而非三字句。也有人提出,RNA中只有两种字母而非四种字母(A和C算同一种字母,U和G算同一种字母),那么就至少要五字句。
遗传学方法
克里克等(1961)利用遗传学上最精密的工具来研究这问题,即大肠杆菌噬菌体T—4中的rⅡ基因。这个基因曾为朋才尔(Benzer,1957)用杂交方法分析到最精细的程度,并为弗里斯(Freese)利用来研究基因突变的分子机制而得到极为辉煌的成就:几乎各种天然突变和诱发突变都可判断其分子结构变化的本性,例如究竟是一个核苷酸被另一核苷酸所代替(例如C被A代替),还是多一个或少一个核苷酸。已知原黄素类的化学药品的作用是在一条多核苷酸链上两个邻近核苷酸之间内插一个核苷酸,因而引起突变。克里克等用原黄素所诱发的一个突变品系,研究它天然的“回复突变”,即从突变型回复成与正常型相关无几的类型。他们发现这些回复突变都是在原来所多出来的一个核苷酸附近又少掉一个核苷酸。用《三字经》譬喻来说,原来原黄素引起的突变可以写成:
“人之初,也性本,善性相,近习相……”除第一句之外,底下都是胡说,因此噬菌体就缺失了一种专性蛋白质分子,所以表现为明显的突变;而回复突变则是:
“人之初,性善也,性相近,习相远……”多了一个字又少掉一个字之后,虽然有一句或少数几句略有出入,但全篇意思不错,所以就“回复”了。
这种回复突变可以通过杂交方法而和最初原黄素所引起的突变分开,一分开就又是突变型而非正常型了:
“人之初,性善性,相近习,相远养,……”这种突变叫做“减字突变”。克里克共获得十几种不同的减字突变。
减字突变品系天然地回复成正常型,则这些回复突变必须是再加了一个字:“人之初,方性善,性相近,习相远……”发生回复之后又可与原来的减字突变分开,而得“加字突变”品系:
“人之初,方性本,善性相,近习相……”因此又得到一系列加字突变品系。
凡一个减字突变与一个加字突变用杂交方法组合在一起,都能回复成正常型。但两个不同的加字突变组合在一起却绝不能回复成正常型:
“人之初,方也性,本善性,相近习……”两个不同的减字突变组合在一起也是这样。但妙在任何三个不同的加字突变组合在一起就总是与正常型相差无几:
“人之初,方生也,性本善,性相近,……”三个减字突变在一起也是这样:
“人之初,性相近,习相远,养不教……”
这个试验证明两点:(1)三字一句,而非四字句或五字句;(2)sRNA并无永远不读破句的能力,只能机械地从头读起,三字一句,直至终篇。
这第二点也有生物化学上的证据。定杰斯(Dintzis,1961)证明血红蛋白分子合成时,的确总是从一端开始,一个个氨基酸接下去的。
人造密码
美国纽约大学的奥巧阿(Ochoa)早在1957年已能用四种核苷酸合成RNA,但人力只能控制核苷酸成分而不能控制核苷酸次序。例如只用U一种,那就合成UUUUU……;也可用很多U和少量A,则合成的RNA链中,A的位置完全是随机的。
奥巧阿等从1961起用这种人工合成的RNA作为信息RNA,加上其它必要条件(sRNA等等),来合成多肽链。结果发现若用……UUUUU……作信息RNA,则合成的多肽链上全是苯丙氨酸。因此,可断定苯丙氨酸的密码是UUU。若用较多的U和较少的A所合成者为信息RNA,则合成的多肽链上只有苯丙氨酸与酪氨酸两种。按A和U的各种比例所合成的酪氨酸比例来推断,酪氨酸的密码当为UUA(但其中次序尚不能断定,也可能是AUU或UAU)。用这种方法,他们把二十种氨基酸的密码都求了出来。同时,美国国立医学研究所的纽伦堡(Nirenberg)和马泰(Matthaei)等,也独立地开展这种工作,而两个实验室的结果极为相符(参见下表)。
氨基酸 奥巧阿 纽伦堡—马泰
丙 UCG UCG
精 UCG UCG
天 冬 UAG —
天冬酰 UAA,UAC —
半胱 UUG UUG
谷 UAG —
谷氨酰 UCG UCG
甘 UGG UGG
组 UAC —
异亮 UUA UUA
亮 UUC,UUG,UUA UUG,UUC
赖 UAA UAA
甲硫 UAG UG?
苯丙 UUU UUU
脯 UCC UCC
丝 UUC UUC,UUG
苏 UAC,UCC —
色 UGG UGG
酪 UUA UUA
缬 UUG UUG
从这些结果看来,密码既有简并也有约束。像亮氨酸就不止一种密码,这就是简并。另外也证明像AAA、GGG等密码是胡说,这就是约束。但字母的次序不同不一定能简并,丙氨酸与精氨酸的密码必有次序的不同,只是目前尚未能测定而已。
西德魏特曼(Wittmann,1961)又利用遗传学方法,用亚硝酸处理烟草镶嵌病毒以诱发突变,然后看突变型与原种在氨基酸方面的差异。发现氨基酸变化总是这几种:已知亚硝酸的作用总是使A变成G,或使C变成U,所以上述结果与奥巧阿等所求出的密码完全符合。
展望
这方面工作前途之远大是无可估计的。人类知道了生物体内各种密码之后就更有把握可以定向改变遗传性,改变动植物品种,控制发育。甚至可以有计划地合成新的核酸样版,获得人类任意设计的遗传性。这些本来是属于科学幻想范围内的事情,现在看来都已接近现实。
值得提出的是奥巧阿等已开始研究人工合成RNA时控制核苷酸次序的办法,正像现在多肽合成中所做到的那样。将来也必然有人研究人工合成DNA时控制核苷酸次序的办法。当然,设法测定天然DNA与RNA分子中核苷酸的次序,也是最重要的研究项目。
快速回复
限200 字节
 
上一个 下一个