2016年09月05日讯 威斯康辛儿童医院的Alan Mayer盯着重症监护室的墙,一副心事重重的样子。因为他的病人,年仅15个月大的Addyson Valley,生命垂危。儿科胃肠专家已给她用了最高剂量的钙和磷,但她的水平仍然低得让人绝望。钙的缺乏使得这名婴儿的心脏几乎停止跳动。
同时,Addyson的肠道正泄漏蛋白质,破坏肠道的功能,人们担心过多的体液会将她的身体变成沼泽。出生之后,Addyson总是生病,在食用大多数食物后发生喷射性呕吐。她的配方奶粉换了一个又一个,检查做了一次又一次,但没有人知道她得了什么病。在进入重症监护室之后,她还是每况愈下。
“我们停止喂她,”Mayer告诉医务人员。说这话时,他意识到他之前经历过这种状况。“Nic的故事又发生了。”
2009年,Mayer及其同事对Nic Volker的外显子组进行了测序,这个男孩患了一种无法确诊的疾病,食物会造成他的肠道穿孔。通过外显子组测序,Mayer等发现了XIAP基因突变,之后利用脐带血进行治疗。Volker也成为世界上第一批通过测序来治病的患者。
如今,Mayer认为Addyson也许可以通过同样的方式来治疗。他采集了女孩的血液样本,用于测序。尽管Nic的测序和分析花了大约四个月的时间,但Addyson的进度要快得多 - 只要4个星期。技术的改进已经提高了测序的速度,同时降低了成本。
测序发现,Addyson在同一个基因DGAT1上有两个独立的突变。这些突变意味着她缺乏关键的酶来吸收脂类。这也解释了她的喷射性呕吐和发育不良。她的身体,特别是她的肠道,排斥任何含有脂类的配方奶粉及其他食物。
出于好奇,Mayer咨询了胃肠病方面的学家,了解他们是否碰到类似的病例。他收到了一些回复,的确有一些患者患有这种新的疾病,都是通过DNA测序诊断的。这种疾病被称为DGAT1缺乏症。“这种疾病无人知晓,直到有了外显子组测序,”Mayer说。
有了诊断结果之后,Mayer给Addyson准备了一份无脂肪的食谱。由于儿童的大脑发育需要脂肪,故Addyson通过静脉注射获得一些。这样脂肪就不会经过她的肠道。如今,这个孩子吃脱脂牛奶,脱脂奶酪、蛋白以及大量的水果和蔬菜。
Addyson已经19个月了,尽管她看上去只有1岁,但她的进步是显著的。她可以自己一个人满屋子走,也喜欢搭积木和听妈妈读书。“这几乎是一个全新的孩子,”她的妈妈说。
对于Addyson的疾病,过去医生是无法诊断的,如今有了外显子组测序,一切变得不同。
人类基因组计划(human genome project, HGP)是由美国科学家于1985年率先提出,于1990年正式启动的。美国、英国、法国、德国、日本和我国科学家共同参与了这一预算达30亿美元的人类基因组计划。按照这个计划的设想,在2005年,要把人体内约20,000--25,000个基因的密码全部解开,同时绘制出人类基因的谱图。换句话说,就是要揭开组成人20,000--25,000个基因的30亿个碱基对的秘密。人类基因组计划与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划。被誉为生命科学的"登月计划"。
人类基因组计划(英语:Human Genome Project, HGP)是一项规模宏大,跨国跨学科的科学探索工程。其宗旨在于测定组成人类染色体(指单倍体)中所包含的30亿个碱基对组成的核苷酸序列,从而绘制人类基因组图谱,并且辨识其载有的基因及其序列,达到破译人类遗传信息的最终目的。基因组计划是人类为了探索自身的奥秘所迈出的重要一步,是继曼哈顿计划和阿波罗登月计划之后,人类科学史上的又一个伟大工程。截止到2005年,人类基因组计划的测序工作已经完成。其中,2001年人类基因组工作草图的发表(由公共基金资助的国际人类基因组计划和私人企业塞雷拉基因组公司各自独立完成,并分别公开发表)被认为是人类基因组计划成功的里程碑。
基因图谱的意义
在于它能有效地反应在正常或受控条件中表达的全基因的时空图。通过这张图可以了解某一基因在不同时间不同组织、不同水平的表达;也可以了解一种组织中不同时间、不同基因中不同水平的表达,还可以了解某一特定时间、不同组织中的不同基因不同水平的表达。
人类基因组是一个国际合作项目:表征人类基因组,选择的模式生物的DNA测序和作图,发展基因组研究的新技术,完善人类基因组研究涉及的伦理、法律和社会问题,培训能利用HGP发展起来的这些技术和资源进行生物学研究的科学家,促进人类健康。
折叠编辑本段其他资料
折叠对人类疾病基因研究的贡献
人类疾病相关的基因是人类基因组中结构和功能完整性至关重要的信息。对于单基因病,采用“定位克隆”和“定位候选克隆”的全新思路,导致了亨廷顿氏舞蹈症、遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因的发现,为这些疾病的基因诊断和基因治疗奠定了基础。对于心血管疾病、肿瘤、糖尿病、神经精神类疾病(老年性痴呆、精神分裂症)、自身免疫性疾病等多基因疾病是目前疾病基因研究的重点。健康相关研究是HGP的重要组成部分,1997年相继提出:“肿瘤基因组解剖计划”“环境基因组学计划”。
折叠对医学的贡献
基因诊断、基因治疗和基于基因组知识的治疗、基于基因组信息的疾病预防、疾病易感基因的识别、风险人群生活方式、环境因子的干预。
折叠对生物技术的贡献
基因工程药物
分泌蛋白(多肽激素,生长因子,趋化因子,凝血和抗凝血因子等)及其受体。
⑵诊断和研究试剂产业
基因和抗体试剂盒、诊断和研究用生物芯片、疾病和筛药模型。
对细胞、胚胎、组织工程的推动
胚胎和成年期干细胞、克隆技术、器官再造。
折叠对制药工业的贡献
筛选药物的靶点:与组合化学和天然化合物分离技术结合,建立高通量的受体、酶结合试验以知识为基础的药物设计:基因蛋白产物的高级结构分析、预测、模拟—药物作用“口袋”。
个体化的药物治疗:药物基因组学。
折叠对社会经济的重要影响
生物产业与信息产业是一个国家的两大经济支柱;发现新功能基因的社会和经济效益;转基因食品;转基因药物(如减肥药,增高药)
折叠对生物进化研究的影响
生物的进化史,都刻写在各基因组的“天书”上;草履虫是人的亲戚——13亿年;人是由300~400万年前的一种猴子进化来的;人类第一次“走出非洲”——200万年的古猿;人类的“夏娃”来自于非洲,距今20万年——第二次“走出非洲”?
折叠带来的负面作用
侏罗纪公园不只是科幻故事;种族选择性灭绝性生物武器;基因专利战;基因资源的掠夺战;基因与个人隐私。
折叠编辑本段应用实例
折叠疾病基因
人类基因组研究的一个关键应用是通过位置克隆寻找未知生物化学功能的疾病基因。这个方法包括通过患病家族连锁分析来绘制包含这些基因的染色体区域图,然后检查该区域来寻找基因。
位置克隆是很有用的,但是也是非常乏味的。当在1980s早期该方法第一次提出时,希望实现位置克隆的研究者们不得不产生遗传标记来跟踪遗传,进行染色体行走得到覆盖该区域的基因组DNA,通过直接测序或间接基因识别方法分析大约1Mb大小的区域。最早的两个障碍在1990s中期在人类基因组项目的支持下随着人类染色体的遗传和物理图谱的发展而清除。然而,剩余的障碍仍然是艰难的。
所有这些将随着人类基因组序列草图的实用性而改变。在公共数据库中的人类基因组序列使得候选基因的计算机快速识别成为可能,随之进行相关候选基因的突变检测,需要在基因结构信息的帮助。
现在,对于孟德尔遗传疾病,一个基因的搜索在一个适当大小的研究小组经常在几个月实现。至少30个疾病基因直接依赖公共提供的基因组序列已经定位克隆到。因为大多数人类序列只是在过去的12个月内得到,可能许多类似的发现还没有出版。
另外,有许多案例中,基因组序列发挥着支持作用,例如提供候选微卫星标识用于很好的遗传连锁分析。(2001年中国上海和北京科学家发现遗传性乳光牙本质Ⅱ型基因)
基因组序列对于揭示导致许多普通的染色体删除综合症的机制同样有帮助。在几个实例中,再发生的删除被发现,由同源体重组合在大的几乎同一的染色体内复制的不等交叉产生。例子包括在第22条染色体上的DiGeorge/ velocardiofacial综合症区和在第7条染色体上的Williams-Beuren综合症的重复删除。
基因组序列的可用性同样允许疾病基因的旁系同源性的快速识别,对于两个理由是有价值的。首先,旁系同源基因的突变可以引起相关遗传疾病。通过基因组序列使用发现的一个很好的例子是色盲(完全色盲)。
CNGA3基因,编码视锥体光感受器环GMP门控通道的a亚单位,显示在一些色盲家系中存在突变体。基因组序列的计算机检索揭示了旁系同源基因编码相应的b亚单位,CNGB3(在EST数据库中没有出现)。CNGB3基因被快速认定为是其他家系的色盲的原因。另一个例子是由早衰1和早衰2基因提供的,它们的突变可能导致Alzheimer疾病的的早期发生。
第二个理由是旁系同源体可以提供治疗敢于的机会,例子是在镰刀状细胞疾病或β地中海贫血的个体中试图再次激活胚胎表达的血红蛋白基因,它是由于β-球蛋白基因突变引起的。
我们在在线人类孟德尔遗传数据库(OMIM)和SwissProt 或TrEMBL蛋白质数据库中进行了971个已知的人类疾病基因的旁系同源体的系统检索。我们识别了286个潜在的旁系同源体(要求是至少50个氨基酸的匹配,在相同的染色体上一致性大于70%但小于90%,在不同的染色体上小于95%)。尽管这种分析也许识别一些假基因,89%的匹配显示在新靶序列一个外显子以上的同源性,意味着许多是有功能的。这种分析显示了在计算机中快速识别疾病基因的潜能。
折叠药物靶
在过去的世纪里,制药产业很大程度上依赖于有限的药物靶来开发新的治疗手段。最近的纲要列举了483个药物靶被看作是解决了市场上的所有药物。知道了人类的全部基因和蛋白质将极大的扩展合适药物靶的寻找。虽然,仅仅人类的小部分基因可以作为药物靶,可以预测这个数目将在几千之上,这个前景将导致基因组研究在药物研究和开发中的大规模开展。一些例子可以说明这一点:
⑴神经递质(5-HT)通过化学门控通道介导快速兴奋响应。以前识别的5-HT3A受体基因产生功能受体,但是比在活体内有小得多的电导。交叉杂交实验和EST分析在揭示已知受体的其他同源体上都失败了。
然而,最近,通过对人类基因组序列草图的低要求检索,一个推定的同源体被识别,在一个PAC克隆中第11号染色体长臂上。同源体显示在纹状体、尾状核、海马中表达,全长cDNA随后得到。这个编码胺受体地基因,被命名为5-HT3B。当与5-HT3A组合成异二聚体中,它显示负责大电导神经胺通道。假定胺途径在精神疾病和精神分裂症的中心作用,一个主要的新的治疗靶的发现是相当有兴趣的。
⑵半胱氨酰基白三烯的收缩和炎症作用,先前认为是过敏反应的慢反映物质(SRS-A),通过特定的受体介导。第二个类似的受体,CysLT2,使用老鼠EST和人类基因组序列的重组得到识别。这导致了与先前识别的唯一的其它受体有38%氨基酸一致性的基因的克隆。这个新的受体,显示高的亲和力和几个白三烯的结合,映射在与过敏性哮喘有关的第13号染色体区域上。这个基因在气道平滑肌和心脏中表达。作为白三烯途径中抗哮喘药物开发中一个重要的靶,新受体的发现有明显的重要的作用。
⑶ Alzheimer疾病在老年斑中有丰富的β-淀粉样物沉积。β-淀粉样物由前体蛋白(APP)蛋白水解生成。有一个酶是β位 APP裂开酶,是跨膜天冬氨酸蛋白酶。公共的人类基因组草图序列计算机搜索最近识别了BACE的一个新的同源序列,编码一个蛋白,命名为BACE2,它与BACE有52%的氨基酸序列一致性。包含两个激活蛋白酶位点和象APP一样,映射到第21条染色体的必须Down综合症区域。它提出了问题,BACE2和APP过多的拷贝是否有功于加速Down综合症病人的脑部β-淀粉样物沉积。
给出了这些例子,我们在基因组序列中进行系统的识别传统药靶蛋白质的旁系同源体。使用的靶列表在SwissPrott数据库中识别了603个入口,有唯一的访问码。
基础生物学
一个例子是:解决了困扰研究者几十年的一个神秘课题:苦味的分子学基础。人类和其他动物对于某一种苦味有不同的响应(响应的多态性)。最近,研究者将这个特征映射到人类和老鼠中,然后检索了G蛋白偶合受体的人类基因组序列草图上的相关区域。这些研究很快导致了该类蛋白的新家族的发现,证明了它们几乎都在味蕾表达,实验证实了在培养细胞中的受体响应特定的苦基质。
人体基因组图谱是全人类的财产,这一研究成果理应为全人类所分享、造福全人类,这是参与人类基因组工程计划的各国科学家的共识。值得关注的是,目前在人类基因组研究领域,出现了一些私营公司争相为其成果申请专利的现象。美国塞莱拉基因公司曾表示,想把一部分研究成果申请专利,有偿提供给制药公司。
找到了一批主宰人体疾病的重要基因
如:肥胖基因、支气管哮喘基因。这类基因的新发现每年都有新报道。这些基因的发现,增进了人们对许多重要疾病机理的理解,并且推动整个医学思想更快的从重治疗转向重预防。例如:湖南医科大学夏家辉教授组于1998.5.28发表克隆了人类神经性高频性耳聋的致病基因(GJB3),这是第一次在中国克隆的基因。
在人类基因组计划的推动下,涌现了几门崭新的学科。如:基因组学(genomics)和生物信息学(bioinformatics)
生物技术的产业化。一批世界级的大公司纷纷把它们的重心转向生命科学研究和生物技术产品。这种趋势或潮流也不能不说和人类基因组计划密切相关。
进展与未来
2000年6月26日,参加人类基因组工程项目的美国、英国、法兰西共和国、德意志联邦共和国、日本和中国的6国科学家共同宣布,人类基因组草图的绘制工作已经完成。最终完成图要求测序所用的克隆能忠实地代表常染色体的基因组结构,序列错误率低于万分之一。95%常染色质区域被测序,每个Gap小于150kb。完成图将于2003年完成,比预计提前2年。
完成人类基因组序列完成图
⑴ 从当前物理图谱生成的克隆产生完成的序列,覆盖基因组的常染色质区域大于96%。大约1Gb的完成序列已经实现。剩下的也已经形成草图,所有的克隆期望达到8~10倍的覆盖率,大约2001年中期(99.99%的正确率),使用已经建立的和日益自动化的协议。
⑵ 检测另外的库来关闭gaps。使用FISH技术或其他方法来分析没有闭合的Gaps大小。22,21条染色体用这种方式。2003年已经完成。
⑶ 开发新的技术来关闭难度较大的gaps,大约几百个。
基因组序列工作框架图(Working draft):通过对染色体位置明确的BAC连续克隆系4-5倍覆盖率的测序(在BAC克隆水平的覆盖率不应低于3倍),获得基因组90%以上的序列,其错误率应低于1%。工作框架图可用于基因组结构的认识、基因的识别和解析、疾病基因的定位克隆,SNP的发现等。
草图的作用
1、草图,许多疾病相关的基因被识别
2、SNP(人与人之间的区别),草图提供了一个理解遗传基础和人类特征进化的框架。
3、草图后,研究人员有了新的工具来研究调节区和基因网络。
4、比较其它基因组可以揭示共同的调控元件,和其他物种共享的基因的环境也许提供在个体水平之上的关于功能和调节的信息。
5、草图同样是研究基因组三维压缩到细胞核中的一个起点。这样的压缩可能影响到基因调控
6、在应用上,草图信息可以开发新的技术,如DNA芯片、蛋白质芯片,作为传统方法的补充,目前,这样的芯片可以包含蛋白质家族中所有的成员,从而在特定的疾病组织中可以找到那些是活跃的。
2001年2月12日,美国Celera公司与人类基因组计划分别在《科学》和《自然》杂志上公布了人类基因组精细图谱及其初步分析结果。其中,政府资助的人类基因组计划采取基因图策略,而Celera公司采取了“鸟枪策略”。至此,两个不同的组织使用不同的方法都实现了他们共同的目标:完成对整个人类基因组的测序的工作;并且,两者的结果惊人的相似。整个人类基因组测序工作的基本完成,为人类生命科学开辟了一个新纪元,它对生命本质、人类进化、生物遗传、个体差异、发病机制、疾病防治、新药开发、健康长寿等领域,以及对整个生物学都具有深远的影响和重大意义,标志着人类生命科学一个新时代的来临。
众多的发现
1、分析得知:全部人类基因组约有2.91Gbp,约有39000多个基因;平均的基因大小有27kbp;其中G+C含量偏低,仅占38%,而2号染色体中G+C的含量最多;到目前仍有9%的碱基对序列未被确定,19号染色体是含基因最丰富的染色体,而13号染色体含基因量最少等等(具体信息可参见cmbi 特别报道:生命科学的重大进展)。
2、目前已经发现和定位了26000多个功能基因,其中尚有42%的基因尚不知道功能,在已知基因中酶占10.28%,核酸酶占7.5%,信号传导占12.2%,转录因子占6.0%,信号分子占1.2%,受体分子占5.3%,选择性调节分子占3.2%,等。发现并了解这些功能基因的作用对于基因功能和新药的筛选都具有重要的意义。
3、基因数量少得惊人:一些研究人员曾经预测人类约有14万个基因,但Celera公司将人类基因总数定在2.6383万到3.9114万个之间,不超过40,000,只是线虫或果蝇基因数量的两倍,人有而鼠没有的基因只有300个。如此少的基因数目,而能产生如此复杂的功能,说明基因组的大小和基因的数量在生命进化上可能不具有特别重大的意义,也说明人类的基因较其他生物体更'有效',人类某些基因的功能和控制蛋白质产生的能力与其他生物的不同。这将对我们目前的许多观念产生重大的挑战,它为后基因组时代中生物医学的发展提供新的非凡的机遇。但由于基因剪切,EST数据库的重复以及一些技术和方法上的误差,将来亦可能人类的基因数会多于4万。
4、人类单核苷酸多态性的比例约为1/1250bp,不同人群仅有140万个核苷酸差异,人与人之间99.99%的基因密码是相同的。并且发现,来自不同人种的人比来自同一人种的人在基因上更为相似。在整个基因组序列中,人与人之间的变异仅为万分之一,从而说明人类不同“种属”之间并没有本质上的区别。
5、人类基因组中存在“热点”和大片"荒漠"。在染色体上有基因成簇密集分布的区域,也有大片的区域只有“无用DNA” ——不包含或含有极少基因的成分。基因组上大约有1/4的区域没有基因的片段。在所有的DNA中,只有1%-1.5%DNA能编码蛋白,在人类基因组中98%以上序列都是所谓的“无用DNA”,分布着300多万个长片断重复序列。这些重复的“无用”序列,决不是无用的,它一定蕴含着人类基因的新功能和奥秘,包含着人类演化和差异的信息。经典分子生物学认为一个基因只能表达一种蛋白质,而人体中存在着非常复杂繁多的蛋白质,提示一个基因可以编码多种蛋白质,蛋白质比基因具有更为重要的意义
6、男性的基因突变率是女性的两倍,而且大部分人类遗传疾病是在Y染色体上进行的。所以,可能男性在人类的遗传中起着更重要的作用。
7、人类基因组中大约有200多个基因是来自于插入人类祖先基因组的细菌基因。这种插入基因在无脊椎动物是很罕见的,说明是在人类进化晚期才插入我们基因组的。可能是在我们人类的免疫防御系统建立起来前,寄生于机体中的细菌在共生过程中发生了与人类基因组的基因交换。
8、发现了大约一百四十万个单核苷酸多态性,并进行了精确的定位,初步确定了30多种致病基因。随着进一步分析,我们不仅可以确定遗传病、肿瘤、心血管病、糖尿病等危害人类生命健康最严重疾病的致病基因,寻找出个体化的防治药物和方法,同时对进一步了解人类的进化产生重大的作用。
9、人类基因组编码的全套蛋白质(蛋白质组)比无脊椎动物编码的蛋白质组更复杂。人类和其他脊椎动物重排了已有蛋白质的结构域,形成了新的结构。也就是说人类的进化和特征不仅靠产生全新的蛋白质,更重要的是要靠重排和扩展已有的蛋白质,以实现蛋白质种类和功能的多样性。有人推测一个基因平均可以编码2-10种蛋白质,以适应人类复杂的功能。
模式生物:酵母(yeast)、大肠杆菌(Escherichia coli)、果蝇(Drosophila melanogaster)、线虫(Caenorhabditis elegans)、小鼠(Mus musculus)、拟南芥、水稻、玉米等等其它一些模式生物的基因组计划也都相继完成或正在顺利进行。
目前基因组学的研究出现了几个重心的转移:一是将已知基因的序列与功能联系在一起的功能基因组学研究;二是从作图为基础的基因分离转向以序列为基础的基因分离;三是从研究疾病的起因转向探索发病机理;四是从疾病诊断转向疾病易感性研究。
在后基因组时代,如果在已完成基因组测序的物种之间进行整体的比较、分析,希望在整个基因组的规模上了解基因组和蛋白质组的功能意义,包括基因组的表达与调控、基因组的多样化和进化规律以及基因及其产物在生物体生长、发育、分化、行为、老化和治病过程中的作用机制都必须发展新的算法以充分利用超级计算机的超级计算能力。
美国和英国科学家2006年5月18日在英国《自然》杂志网络版上发表了人类最后一个染色体——1号染色体的基因测序。
在人体全部22对常染色体中,1号染色体包含基因数量最多,达3141个,是平均水平的两倍,共有超过2.23亿个碱基对,破译难度也最大。一个由150名英国和美国科学家组成的团队历时10年,才完成了1号染色体的测序工作。
科学家不止一次宣布人类基因组计划完工,但推出的均不是全本,这一次杀青的“生命之书”更为精确,覆盖了人类基因组的99.99%。解读人体基因密码的“生命之书”宣告完成,历时16年的人类基因组计划书写完了最后一个章节。
2、疾病基因的定位克隆
人类基因组计划的直接动因是要解决包括肿瘤在内的人类疾病的分子遗传学问题。6000多个单基因遗传病和多种大面积危害人类健康的多基因遗传病的致病基因及相关基因,代表了对人类基因中结构和功能完整性至关重要的组成部分。所以,疾病基因的克隆在HGP中占据着核心位置,也是计划实施以来成果最显著的部分。
在遗传和物理作图工作的带动下,疾病基因的定位、克隆和鉴定研究已形成了,从表位→蛋白质→基因的传统途径转向“反求遗传学”或“定位克隆法”的全新思路。随着人类基因图的构成,3000多个人类基因已被精确地定位于染色体的各个区域。今后,一旦某个疾病位点被定位,就可以从局部的基因图中遴选出相关基因进行分析。这种被称为“定位候选克隆”的策略,将大大提高发现疾病基因的效率。
3、多基因病的研究
目前,人类疾病的基因组学研究已进入到多基因疾病这一难点。由于多基因疾病不遵循孟德尔遗传规律,难以从一般的家系遗传连锁分析取得突破。这方面的研究需要在人群和遗传标记的选择、数学模型的建立、统计方法的 改进等方面进行艰苦的努力。近来也有学者提出,用比较基因表达谱的方法来识别疾病状态下基因的激活或受抑。实际上,“癌肿基因组解剖学计划(Cancer Genome Anatomy Project,CGAP”就代表了在这方面的尝试。
展望
1、生命科学工业的形成
由于基因组研究与制药、生物技术、农业、食品、化学、化妆品、环境、能源和计算机等工业部门密切相关,更重要的是基因组的研究可以转化为巨大的生产力,国际上一批大型制药公司和化学工业公司大规模纷纷投巨资进军基因组研究领域,形成了一个新的产业部门,即生命科学工业。
2、功能基因组学
人类基因组计划当前的整体发展趋势是什么?一方面,在顺利实现遗传图和物理图的制作后,结构基因组学正在向完成染色体的完整核酸序列图的目标奋进。另一方面,功能基因组学已提上议事日程。人类基因组计划已开始进入由结构基因组学向功能基因组学过渡、转化的过程。在功能基因组学研究中,可能的核心问题有:基因组的表达及其调控、基因组的多样性、模式生物体基因组研究等。
2)蛋白质组学研究
蛋白质组学研究是要从整体水平上研究蛋白质的水平和修饰状态。目前正在发展标准化和自动化的二维蛋白质凝胶电泳的工作体系。首先用一个自动系统来提取人类细胞的蛋白质,继而用色谱仪进行部分分离,将每区段中的蛋白质裂解,再用质谱仪分析,并在蛋白质数据库中通过特征分析来认识产生的多肽。
蛋白质组研究的另一个重要内容是建立蛋白质相互关系的目录。生物大分子之间的相互作用构成了生命活动的基础。组装基因组各成分间的详尽作图已在T7噬菌体(55个基因)获得成功。如何在模式生物(如酵母)和人类基因组的研究中建立自动方法,认识不同的生化通路,是值得探讨的问题。
3)生物信息学的应用
目前,生物信息学已大量应用于基因的发现和预测。然而,利用生物信息学去发现基因的蛋白质产物的功能更为重要。模式生物体中越来越多的蛋白质构建编码单位被识别,无疑为基因和蛋白质同源关系的搜寻和家族的分类提供了极其宝贵的信息。同时,生物信息学的算法、程序也在不断改善,使得不仅能够从一级结构,也能从估计结构上发现同源关系。但是,利用计算机模拟所获得的理论数据,还需要经过实验经过的验证和修正。
⑵基因组多样性的研究
人类是一个具有多态性的群体。不同群体和个体在生物学性状以及在对疾病的易感性与抗性上的差别,反映了进化过程中基因组与内、外部环境相互作用的结果。开展人类基因组多样性的系统研究,无论对于了解人类的起源和进化,还是对于生物医学均会产生重大的影响。
1)对人类DNA的再测序
可以预测,在完成第一个人类基因组测序后,必然会出现对各人种、群体进行再测序和精细基因分型的热潮。这些资料与人类学、语言学的资料项结合,将有可能建立一个全人类的数据库资源,从而更好地了解人类的历史和自身特征。另外,基因组多样性的研究将成为疾病基因组学的主要内容之一,而群体遗传学将日益成为生物医药研究中的主流工具。需要对各种常见多因素疾病(如高血压、糖尿病和精神分裂症等)的相关基因及癌肿相关基因在基因组水平进行大规模的再测序,以识别其变异序列。
总之,模式生物体的基因组计划为人类基因组的研究提供了大量的信息。今后,模式生物体的研究方向是将人类基因组8~10万个编码基因的大部分转化为已知生化功能的多成分核心机制。而要获得酶一种人类进化保守性核心机制的精细途径,以及它们的紊乱导致疾病的各种途径的知识,将只能来自对人类自身的研究。
通过功能基因组学的研究,人类最终将将能够了解哪些进化机制已经确实发生,并考虑进化过程还能够有哪些新的潜能。一种新的解答发育问题的方法可能是,将蛋白质功能域和调控顺序进行重新的组合,建立新的基因网络和形态发生通路。也就是说,未来的生物科学不仅能够认识生物体是如何构成和进化的,而且更为诱人的是产生构建新的生物体的可能潜力。该计划在人类科学史上又竖起了一座新的里程碑!这是一项改变世界,影响人类生活的壮举,随着时间的推移,它的伟大意义将愈显昭彰。
叠编辑本
人类基因组计划启动于1990年,原计划用15年时间即到2005年完成全部30亿碱基对序列测定,但由于它在科学上的巨大意义和商业上的巨大价值,使得这一计划完成时间一再提前。1998年对原计划进行了修改,宣布提前两年即2003年完成序列测定。今年5月9日,国际人类基因组宣布完成第一阶段——人类基因组序列“工作框架图”的构建。5月10日,在美国冷泉港举行的国际基因组高峰会议上,6国16个基因组负责人研究决定,将“人类基因组DNA序列图”完成时间再提前两年,即2001年6月全部完成。
这内中一定有什么原因。
什么是人类基因组计划
人类基因组计划国际组织中国联系人、中科院遗传所人类基因组中心主任杨焕明教授介绍说,基因,是决定一个生物物种的所有生命现象的最基本的因子。决定一个物种之所以是这个物种,是由它的遗传信息决定的,而遗传信息的载体,就是DNA(脱氧核糖核酸)。DNA就是基因的实体。
杨焕明说,人类的遗传物质是DNA,它的总和就是人类基因组,人体估计有6—10万个基因,由大约30亿碱基对组成,分布在细胞核的23对染色体中。人类基因组计划是用大撒网的方法,将人的所有基因一网打尽,即测定人类基因组的全部DNA序列,从而解读所有遗传密码,揭示生命的所有奥秘。这项计划一旦完成,我们将清楚地了解一个人为什么会成为色盲,为什么会发胖、秃顶,易患这种疾病而不是另外的疾病等等。正由于此,它是一项改变世界、影响到我们每一个人的科学计划。
诺贝尔奖获得者杜伯克于1986年在《科学(Science)》杂志上发表的一篇短文中率先提出了这个计划。1988年,该计划正式获得2790万美元的美国国会拨款,并于1990年10月1日正式启动。其总体规划是:拟在15年内至少投资30亿美元,进行对人类基因组的分析。不久,该计划发展成一个由多国政府支持的国际项目,先后有美、英、日、德、法及中国等6个国家参加,有16个实验室及1100名生物科学家、计算机专家和技术人员参与。
人类基因组计划一直是美国乃至世界新闻媒体的报道热点。美国《时代》周刊,每年都把该计划的进展作为一年一度的重大新闻加以传播,同时政府散发小册子加以普及。特别是该计划不断取得一些阶段性成果。比如分离出某种致病基因,使得该病能够被预测、诊断,最终被攻克,由此在公众中产生巨大影响。经过多年努力,该计划在美、英等国几乎家喻户晓。我国媒体近一两年对该计划报道逐渐增多、升温,但公众对此了解还远不够深入透彻,许多人仍不清楚何为基因,更谈不上对人类基因组计划整体了解,作为这项宏伟计划的6个参与国之一,我们有必要而且必须了解上述人类基因组计划的基本内容。
我国加盟人类基因组计划
我国人口占世界人口总数的22%,是一个多民族的群体,我们丰富的人群遗传资源是研究人类基因组多样性、人类进化以及人类疾病相关基因的宝贵材料。国家高技术发展计划(863计划)自1987年开始就注意资助研究基因组的有关技术,我国的人类基因组计划正式启动于1994年,重大项目《中华民族基因组若干位点基因结构的研究》由国家自然科学基金委员会、863计划和国家重点基础研究计划(973)所共同资助。1998年8月,中国科学院遗传研究所人类基因组中心在京成立;随后,国家人类基因组南方和北方研究中心相继成立。1999年7月,我国在国际人类基因组HGSI注册。同年9月,我国科学家应邀出席在英国剑桥召开的第五次人类基因组大规模测序战略研讨会,商定我们的“包干区域”。中科院遗传所人类基因组中心与国家人类基因组南方和北方中心共同承担了国际人类基因组大规模测序任务的1%,即3号染色体短臂从D3S3610至端粒的30Mb区域上3000万个碱基对的测序任务。1999年11月,科技部、中科院和国家高技术计划生物领域专家为此在北京联合召开了专家论证会,由吴?院士任论证会专家组组长。根据专家评审意见,该项目立项申请得到批准。今年4月份我国完成了1%人类基因组测序“工作框架图”(覆盖率90%)构建。自此我国人类基因组测序与世界同步进入了第二阶段:完全解析人类基因组30亿碱基的顺序,制作出一张“完成序列图”,把人类基因组整体序列的准确率提高到99.99%。
据国家人类基因组南方研究中心主任、中科院院士陈竺介绍,在过去6年中,我国科学界共同努力组织了一批高水平的医学中心和遗传学领域内的国家和部门重点实验室,建立了全国性的遗传资源收集、保存网络,引进和建立了包括遗传和物理作图、大规模DNA测序、基因定位、克隆、突变检测和生物信息学等在内的较完整的基因组研究体系,同时也获得了一批重要研究成果。特别是承担并完成国际1%人类基因组测序任务,这一事件向世界表明,作为参与该任务的唯一的发展中国家,我国人类基因组大规模测序工作已经开始,并具有相当的实力。
杨焕明教授说:“不要小看这1%,它代表着中国科学家在未来的基因工程产业中占有一席之地。在这个划时代的里程碑上,已经刻上了中国人的名字。通过参与这一计划,我们可以分享数据、资源、技术与发言权,最终来开发我国自己的基因资源。”
据了解,我国已成为参与DNA序列图构建的全球16个基因组中心里的十强之一。
人类基因组计划风雨兼程
尽管人类基因组计划是以为人类造福为宗旨,一开始就提倡“国际参与、免费分享”,是“公益计划”,但人类基因组计划已经产生的和将要产生的巨大经济价值,不能不让唯利是图的私营企业眼红。该计划一再提前,与私营企业争夺基因专利、基因资源密切相关。
为基因申请专利,就意味着垄断了将来以这些基因所开发出来的相关产品的权利。一条有重要功能的基因,价值在数百万至数千万美元之间,有的甚至上亿。如“肥胖基因”的转让费达1.4亿美元。
基因垄断遭到了世界上有识之士的反对。我国专家杨焕明等指出,假如基因序列本身也被允许专利,后果是信息垄断,所有基因的发现都只会归利于几家捷足先登的大公司所有。杨焕明进而提醒说:“人类只有一个基因组,不存在白种人基因组、黄种人基因组之分,全人类所有成员在根本上是一致的,对任何一个人基因组的研究,代表了全人类的一致性信息。人类基因数目是有限的,发现一个少一个,基因被‘专利’,等于说,谁发现了某个基因,这个基因就归谁。这是在抢啊,就像当年哥伦布登陆抢滩一样!”
谈到人类基因组计划一再提前,就不能不提起一家名为塞莱拉的美国私营公司。1998年5月,帕金·埃尔默这个全球最大的DNA自动测序仪厂家,投资3亿美元组建塞莱拉公司,声称在3年内完成人类基因组的序列测定,目的是抢在人类基因组计划前完成,垄断人类基因组信息。1999年5月,他们又将这一目标提前一年。今年4月6日,塞莱拉公司突然宣布完成了基因测序工作。4天后,美国国家人类基因组研究所所长弗朗西斯·柯林斯发表声明说,塞莱拉的测序结果值得怀疑,他们本该对基因测序数据核查10次,却只核对3次。
姑且不论塞莱拉的测序结果是否可信,只说这家私营公司与人类基因组计划竞争态势昭然若揭。它逼迫人类基因组国际组织于今年5月10日再次将测序完成时间提前两年。我国科学家陈竺院士最近对此评价说:“塞莱拉公司科学家在基因组研究方面的胆识,却助长了该公司与公共领域相悖的势头。出于商业目的,包括塞莱拉等在内的一些私营机构力图获得基因组数据的专利,或在相当长的时间内封锁有关数据。这种做法违背了大多数公众的利益,也妨碍了科学的进步,因此遭到科学界的反对。今年3月14日,美国总统克林顿和英国首相布莱尔联合声明支持基因组数据公开的政策,使垄断基因组数据的企图明显受挫。然而,‘公’‘私’之争并未结束。”陈竺建议,既然我国已加入国际公共领域的人类基因组计划,我国政府也应该在基因组数据公开这一重大原则问题上表态。
正是在这种基因专利、基因垄断、基因资源的论战和争夺中,在基因测序成本大幅下降中,在有关各国政府的巨资投入和大力支持中,在全世界科学家的大合作和大竞赛情势下,人类基因组计划如离弦之箭,飞速奔往目标……
基因组计划将影响到诸多方面
中科院遗传所人类基因组中心副主任于军教授长期在美国最具实力的基因组中心工作。他认为,人类基因组计划使基因组学再生,也使其走出了“象牙塔”,成为生命科学乃至生物技术及相关产业的先遣学科。
陈竺说,人类基因组计划为推动医学进步带来了空前的机遇。一般而言,某一致病基因被发现后,数月内即可用于诊断。疾病的基因诊断有可能发展成医学的重要分支和实现产业化。在婴儿时期的基因筛查有可能识别出疾病基因或风险基因的携带者,这一被称为“预测医学”的做法,固然为疾病的早期预防提供了便利,但同时也带来一系列伦理、法律和社会学问题。诸如:病人的隐私权如何得到保护?他们的就业和保险是否会受到影响?是否会在社会上受到“遗传歧视”,等等。
随着人类基因组向“完成序列图”的目标进行,以揭示基因组功能及调控机制为目标的功能基因组学以及医学(疾病)基因组学也已提上了议事日程。科学家预测,在未来10—20年里,人类将解读所有模式生物、模式基因组和代表生物的遗传密码。截至2000年4月15日,国际人类基因组计划已对29种微生物、面包酵母、大肠杆菌和线虫进行了100%测序,对果蝇的测序接近100%,对小鼠的全基因组测序工作也全面展开。人类基因组计划还对几十种病原微生物的基因组进行了序列测定,如与胃病发生密切相关的幽门螺杆菌,引起肺病的结核杆菌和引起梅毒的螺旋体等等基因组测序都已完成,为阐明这些疾病发生的分子机理,设计诊断、治疗和预防的新方法提供了可能性,拥有良好的商业机会。
人类基因组计划进行中需要数学、物理、化学等学科配合,从而带动了相关学科的发展。在新技术开发上,需要发展高产率、自动化的DNA测序新技术和数据分析新技术,基因组数据库和分析软件,基因芯片技术等等,所有这些都提供了很大的开发机会。在农业方面,人类基因组所积累的知识和技术可用于对农作物进行遗传修饰,使之具有某些特殊的性能,如抗逆、抗病、抗旱、抗盐碱、抗寒、抗虫害、抗杀虫剂等等,并且高产高质。在这个领域创造的经济效益将是难以估量的。
本文地址:http://dadaojiayuan.com/jiankang/300832.html.
声明: 我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本站部分文字与图片资源来自于网络,转载是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们(管理员邮箱:douchuanxin@foxmail.com),情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
上一篇: Nature发布癌症研究重要成果