许多全球性或地区性卫生与健康问题,诸如全球流行的艾滋病等传染病,全人类共同的癌症和心脑血管疾病等慢性病,危害全人类健康及安全的温室效应,臭氧空洞等以及其他灾害,许多国家面临的生态破坏、环境污染等问题,只有靠全人类共同努力才能解决。因此,国际分工、协作和交流日益加强,从人类基因组计划这类微观研究到地球生物圈这类宏观研究都是由世界上许多国家甚至是所有国家协作进行的。
《Circulation 》杂志最近发表加拿大多伦多大学华裔学者刘宗正领导的国际合作研究,心血管系统多数活化基因被发现。参与合作单位今后分路进行:多伦多大学寻找心衰的基因,香港中文大学寻找冠脉粥样硬化疾病基因,中国大陆研究造成高血压和中风的疾病基因。
人类基因组计划 (Human Genome Project, HGP) 是美国科学家 Renato Dulbecco于1986年在《Science》杂志上发表的短文中率先提出的, 旨在阐明人类基因组的全部序列,从整体上破译人类遗传信息,使人类第一次在分子水平全面认识自我。美国于1990年正式启动人类基因组计划,预计在15年时间内提供30亿美元的资助。欧共体、日本、加拿大、前苏联、巴西和印度等国也提出了类似的计划。由于各国政府和科学家的共同努力,HGP已成为全球性的重大国际合作项目, 为此还专门成立了国际人类基因组组织(HUGO)来统一协调这一计划,目前已有15个国家和欧共体加入HUGO。
人类基因组计划的意义十分重大,因为它不仅能通过揭示人类生命活动的遗传学基础而带动整个生命科学的发展,而且将成为21世纪的分子医学(基因诊断、 基因治疗和基因工程产品开发)奠定基础。6千多种人类单基因遗传病和一批严重危害人类健康的多基因病(如恶性肿瘤、心血管疾病等)将有可能得到预防、诊断和治疗,农业、工业和环境科学也将从中获益非浅。
人类基因组计划已取得一些重要的成果,概述如下:
HGP自1990年10月正式启动至今已有7年多时间,这7 年所取得的成就使得人们不再像80年代后期那样对HGP 的可行性持怀疑态度,正如美国 HGP负责人 Francis Collins 所说的,我们已从人类基因组计划中学到最重要的一课是,这个计划是完全可以的。而且在HGP执行至今,人们发现在资金未能到达原定资助强度的条件下,已提前完成了原定的进度。HGP主要包括四项任务:(1)遗传图谱的建立;(2) 物理图谱的建立;(3)DNA顺序测定;(4)基因的识别。 具体来说这几年来有着如下四个方面的进展:
(1) 遗传图谱
遗传图谱是通过计算机连锁的遗传标志之间的重组频率来确定它们之间的相对距离。至1994年底,在法国和美国科学家共同努力之下,完成了应用RFLP 标志和可用PCR方法进行批量分析的微卫星DNA为标志,包含5826个位点,覆盖400cM, 分辨率高达0.7cM的遗传图谱的制作。1996年3月法国科学家又报道了完全为微卫星标志构建的遗传连锁图,其中包括2335个位点,分辨率为1.6cM。 这些工作提前完成了原定于1998年完成的分辨率为2~5cM的计划,不仅为进一步的物理图谱构建提供了重要的依据,还可应用这张遗传图谱,通过基因组扫描技术,对那些具有复杂性状的多基因病(如高血压、糖尿病、冠心病等)进行连锁分析,以完成这些疾病所涉及的易感基因的定位。
(2) 物理图谱
物理图谱用于确定各遗传标志之间的物理距离,其制作主要是通过大片段 DNA操作技术,对标志进行定序和距离测定,为基因的分离、识别和基因组DNA 顺序测定奠定基础。物理图谱的构建这几年也有了长足的进步:建立了以15086 个顺序标签位点为标志,分辨率达199kb的物理图谱和构建了由225个YAC 连续克隆重叠群组成的、覆盖范围达整个人类基因组75%的物理图谱。此外, 应用放射杂交制图技术来制作物理图谱也在紧锣密鼓地进行中。
(3) DNA顺序测定
人类基因组全部DNA顺序的测定是HGP的核心部分,在过去的几年中这方面也有了异常迅猛的发展。目前随着遗传和物理图谱工作的已经和即将完成,测序就成为今后10年工作的重中之重。在基因组计划上马之际,完成的最长的DNA顺序是250kb的巨细胞病毒顺序,花费了数年时间。而今,一个大测序中心可在一个月内完成一个细菌基因组(大于1Mb)的测序工作。到目前为止世界上已有L·Hood、B·Booe 和Sanger中心等三个研究小组完成了长度大于1Mb的人基因组顺序测定,其中包括T细胞受体区段、9号及22号染色体部分区段和Huntington舞蹈病基因区段。大规模DNA测序技术以及分析大片段DNA序列的生物信息技术的进步。 对完成人类基因组全部核苷酸顺序测定起着决定性作用,目前的方法有待进一步改进乃至革命。预期全部人类基因组测序工作将于2005年之前完成。
(4) 基因的识别
HGP的重要内容之一,是识别全部人类基因即基因组中发生转录表达功能单位,并对其结构进行研究。目前常采用的策略有二:(1)从基因组DNA顺序中识别那些转录表达顺序即基因;(2)随机从cDNA文库中挑取克隆并进行部分测序。 这些随机测出的部分cDNA顺序称为表达顺序标签(EST)。 根据转录顺序的位置和距离绘制的图谱即转录图。过去几年里许多重要疾病( 如脆性X综合症、 Huntigton 舞蹈病、Wilson氏病、多囊肾病)的致病基因被通过定位克隆技术克隆,而随着转录图中所定位的基因的密度和精度的提高,定位克隆技术将逐步被定位候选克隆法所取代。
人类基因组计划中还包括若干个模式生物体基因组计划,我国重点支持的水稻基因组研究计划亦可划入这一范畴。模式生物体一直就是生命科学领域研究的基本模型,加之它们与人类相比基因组结构简单、单位DNA长度上基因密度高, 易于基因的识别,而且从低等至高等的各个模式生物是研究基因分子进化的绝佳材料。各模式生物体之间的比较性研究将有助于人类基因的结构与功能的阐明。对于在整体水平研究基因的功能,模式生物体更有着无法取代的地位。
我国人类基因组研究概况
我国的基因组研究工作起步较晚,而且是基础差、底子薄、资金少,与国际上这几年HGP的惊人速度相比,我们的差距很大,并且这种差距有进一步加大的可能。中国生命科学界应在如下几个方面共同努力:
1. 尽快收集和利用我国宝贵的多民族基因组资源和遗传病家系材料, 并阻止这些资源盲目流向国外。
2. 集中人力、物力和财力,建立互相配套的、集分子遗传学、 自动化技术和信息技术为一体的中心,才能卓有成效地开展工作。
3. 根据我国国情和原有工作基础,做到有所为有所不为, 走“短平快”和出奇制胜的道路,直接楔入基因组研究中最为关键的部分-基因识别,如走“cDNA计划”道路,尽可能地克隆一大批新基因,在人类8万~10 万个基因中占有一定的份额。同时,由于基因组DNA测序是一项劳动和技能密集性工作,如能引进技术, 培训一支高水平的技术队伍,完全有可能将人类基因组测序的一部分工作吸引到我国。
4. 充分利用国际基因数据库中已有信息,建立生物信息技术, 推进我国基因组研究工作,并在基因组转录顺序的认识及基因功能推测方面多做工作。
5. 多渠道筹措资金,在维护知识产权的前提下开展国际间合作。
历史已将中国当代科学家推上了人类基因组计划这一国际合作和竞争的大舞台,他们责无旁贷地要为供养自己的国家和人民负责,为21世纪中国的科学、技术和产业负责,唯有高瞻远瞩地认清当前的形势和不辞劳苦、不计得失地拼搏,才有可能在国际人类基因组计划中占有一席之地,有着交换和分享数据的资本,共同品尝人类基因组这一全人类的“圣餐”。
我国1994年启动HGP,现已完成南北方两个汉族人群和西南、东北地区12个少数民族共733个永生细胞系的建立,为中华民族基因保存了宝贵的资源,并在多民族基因组多样性的研究中取得了成就,在致病基因研究中有所发现。定名为中华民族基因组结构和功能研究的HGP为“九五”国家最大的资助研究项目之一(700万元),为我国在下世纪国际HGP科学的新一轮竞争中占据有利地位打好了基础。