(二)启动子
启动子(promoter,P)是指能被RNA聚合酶识别、结合并启动基因转录的一段DNA序列。操纵元至少有一个启动子,一般在第一个结构基因5′侧上游,控制整个结构基因群的转录。用RNA聚合酶与分离的一段DNA双链混合,再加入外切核酸酶去水解DNA,结果只有被RNA聚合酶识别结合而被保护的那段DNA不被水解,由此可以测出启动子的范围及其序列。虽然不同的启动子序列有所不同,但比较已经研究过的上百种原核生物的启动子的序列,发现有一些共同的规律,它们一般长40-60bp,含A桾碱基对较多,某些段落是很相似的,这些相似的保守性段落称为共有性序列(consensus sequences)。如图19-4所示,启动子一般可分为识别(R,recognition)、结合(B,binding)和起始(I, initiation)三个区段。转录起始第一个碱基(通常标记位置为+1)最常见的是A;在-10bp附近有TATAAT一组共有序列,因为这段共有序列是Pribnow首先发现的,称为Pribnow盒(Pribnow box);在-35bp处又有TTGACA一组共有序列 。
启动子名称 | -35区 | -10区 | +1 |
P trp | ……TTGACA…… | N17……TTAACT… | N7……A…… |
P tyr-tRNA | ……TTTACA…… | N16……TATGAT… | N7…G…… |
P lac | ……TTGACA…… | N17……TATGTT… | N7…A…… |
P recA | ……CTGATG…… | N17……TATAAT… | N7…A…… |
P ara | ……TTGACA…… | N17……TACTGT… | N7…A…… |
λPR | ……TTGACA…… | N17……GATAAT… | N6…A…… |
λPL | ……TTGACA…… | N17……GATACT… | N6…A…… |
T7 A2 | ……TTGACA…… | N17……TACGAT… | N6…A…… |
fd Ⅷ | ……TTGACA…… | N17……TATAAT… | N6…G…… |
图19-4 原核生物基因转录起始区
不同的启动子序列不同,与RNA聚合酶的亲和力不同,启动转录的频率高低不同,即不同的启动子起动基因转录的强弱不同,例如:PL、PR、PT7属强启动子,而P1ac则是较弱的启动。
(三)操纵子
操纵子(operator)是指能被调控蛋白特异性结合的一段DNA序列,常与启动子邻近或与启动子序列重叠,当调控蛋白结合在操纵子序列上,会影响其下游基因转录的强弱。以前许多书中将操纵子称为操纵基因(operator gene)。但现在基因定义是为蛋白质编码的核酸序列,而操纵序列并不是编码蛋白质的基因,却是起着调控基因表达强弱的作用,正如启动序列不叫启动基因而称为启动子一样,操纵序列就可称为操纵子。以前将operon译为操纵子则可改译为操纵元,即基因表达操纵的单元之意。
举乳糖操纵元中的操纵子为例,如图19-5所示,其操纵子(o)序列位于启动子(p)与被调控的基因之间,部分序列与启动子序列重叠。仔细分析该操纵子序列,可见这段双链DNA具有回文(palindrome)样的对称性一级结构,能形成十字形的茎环(stem loop)构造。不少操纵子都具有类似的对称性序列,可能与特定蛋白质的结合相关。
图19-5 乳糖操纵元的P-O区及O区序列
阻遏蛋白与操纵子结合,就妨碍了RNA聚合酶与启动子的结合及其后β-半乳糖苷酶等基因的转录起始,从而阻遏了这群基因的表达。最早只把与阻遏蛋白结合、起阻遏作用的序列称为操纵子,但其后发现有的操纵元中同一操纵序列与不同构像的蛋白质结合,可以分别起阻遏或激活基因表达的作用,阿拉伯糖操纵元中的序列就是典型的例子。因而凡能与调控蛋白特异性结合、从而影响基因转录强弱的序列,不论其对基因转录的作用是减弱、阻止或增强、开放,都可称为操纵子。
(四)调控基因
调控基因(regulatory gene)是编码能与操纵序列结合的调控蛋白的基因。与操纵子结合后能减弱或阻止其调控基因转录的调控蛋白称为阻遏蛋白(repressive protein),其介导的调控方式称为负性调控(negative regulation);与操纵子结合后能增强或起动调控基因转录的调控蛋白称为激活蛋白(activating protein),所介导的调控方式称为正性调控(positive regulation)。
某些特定的物质能与调控蛋白结合,使调控蛋白的空间构像发生变化,从而改变其对基因录的影响,这些特定物质可称为效应物(effector),其中凡能引起诱导发生的分子称为诱导剂(inducer),能导致阻遏发生的分子称为阻遏剂或辅助阻遏剂(corepressor)。
例如在乳糖操纵元中,调控基因1ac I位于P1ac邻近,有其自身的启动子和终止子,转录方向和结构基因群的转录方向一致,编码产生由347个氨基酸组成的调控蛋白R,在环境没有乳糖存在的情况下,R形成分子量为152000的活性四聚体,能特异地与操纵子o紧密结合,从而阻止利用乳糖的酶类基因的转录,所以R是乳糖操纵元的阻遏蛋白;当环境中有足够的乳糖时,乳糖受β-半乳糖苷酶作用转变为别乳糖,别乳糖与R结合,使R的空间构像变化,四聚体解聚成单体,失去与操纵子特异性紧密结合的能力,从而解除了阻遏蛋白的作用,使其后的基因得以转录合成利用乳糖的酶类。在这过程中乳糖(实际起作用的是别乳糖)就是诱导剂,与R结合起到去阻遏作用(derepression),诱导了利用乳糖的酶类基因转录开放。
许多调控蛋白都是变构蛋白(allosteric protein),通过与上述类似的方式与效应物结合变空间构像,从而改变活性,起到调节基因转录表达的作用。