2016年08月25日讯 全基因组关联研究(GWAS)鉴定了数百个心血管代谢疾病(CMD)的风险位点。这些DNA位点大多位于非编码区域,但人们对相应的基因调控机制还知之甚少。西奈山伊坎医学院的研究人员对六百名冠心病患者的不同组织进行了基因分型和RNA测序。
“通过分析多个组织的基因表达数据,我们鉴定了在单一组织起作用的致病基因,也发现了以网络形式跨组织起作用的致病基因,”这篇文章的资深作者,西奈山伊坎医学院的Johan Bj?rkegren教授说。
这是首次对冠心病(CAD)患者血液、血管和代谢组织的RNA序列进行系统性分析。这项具有里程碑意义的研究是STARNET项目的一部分,于八月十九日发表在Science杂志上。
“全基因组关联研究鉴定了大量会提升CAD风险的DNA变异,”Dr. Bj?rkegren。“然而,全基因组关联研究只是了解CAD的第一步,要将风险指标转化为新的诊疗机遇,我们必须迈入下一个阶段,找到受这些DNA变异影响而推动疾病发展的基因。此外,我们也需要了解疾病基因在哪些组织、通路和分子网络中起作用。像STARNET项目这样鉴定疾病驱动基因和相应组织,是实现精准医疗和个性化诊疗的前提。”
STARNET项目是Dr. Bj?rkegren和Arno Ruusalepp在2007年启动的。研究人员在冠状动脉搭桥手术中收集了600名CAD患者的一些关键组织。他们发现,这些组织中的基因表达数据能够提供宝贵的信息,不仅可以揭示CAD致病基因及其活性,对研究其他心血管代谢疾病和阿尔茨海默症也很有帮助。
“我们惊讶的发现,除了肝脏以外,腹部脂肪对于调控血脂水平也很关键,”文章第一作者Oscar Franzén博士说。“举例来说,控制低密度脂蛋白(LDL)血液水平的PCSK9基因居然是在腹部脂肪中起作用的,而不是在调控血脂水平的主要场所--肝脏。” 最近,PCSK9作为降脂药物的新靶标受到了很大的关注。
STARNET这样的基础研究项目有助于探索CAD和其他复杂疾病的病因,“此前GWAS鉴定了不少DNA位点,我们明确了这些位点影响的基因。研究显示,许多基因所在的调控网络涉及多种组织和疾病,”文章的另一位资深作者Eric Schadt教授说。现在研究人员正在与阿斯利康和SciLifeLab合作,尝试开发新的药物靶标。
冠心病是一种临床上常见的疾病,严重威胁着人类的健康。在冠心病中,由于冠状动脉病理性改变,脂肪沉着堆积在冠状动脉内膜细胞内并引起血流阻塞。这种疾病与血液中的脂肪含量有关,包括低密度脂蛋白(LDL胆固醇)、高密度脂蛋白(HDL胆固醇)和甘油三酯。近10年来,随着生活水平的提高和平均寿命的延长,我国冠心病发病率正在逐年上升,而且还有年轻化的趋势。
Ottawa大学、Oxford大学和Broad研究所的科学家们在一项大规模研究中解决了心血管领域的一个长期争议。研究人员通过千人基因组计划(1000 Genomes project)的数据库,获得了将近一千万遗传学变异(SNP)的信息,涉及全球48项研究的六万冠心病患者和十二万健康人。他们对冠心病(CAD)的遗传学背景进行了全面的考察。研究显示,这种常见疾病的遗传易感性主要取决于影响较小的普通SNP,而不是影响较大的罕见变异。
人们已经了解了LDL在心脏病中的作用,并将其作为statin类药物的作用靶标。但HDL、甘油三酯和心脏病之间的关联仍旧未能阐明。Broad研究所、麻省总医院等机构的科学家们通过大规模外显子测序发现,APOC3基因上的四个突变不仅能降低血液中的甘油三酯水平,还能显著减少个体患冠心病的风险(约40%)。这项研究发表在《新英格兰医学》杂志上,为人们提供了治疗冠心病的新途径。
顶级医学期刊《柳叶刀》发表的一项大规模研究表明,工作时间长会显著提升中风和冠心病的患病风险。加班加点地工作的确不利于健康,甚至会危及你的生命。伦敦大学学院的研究人员用25项研究的数据分析了工作时间与冠心病之间的关系。他们发现,与标准工作时间(每周工作35-40小时)相比,每周工作55小时以上会使冠心病风险提高13%。
相比chip-chip,chip-seq提供了更高的分辨率,更少的noise以及更大的覆盖度。随着二代测序成本的快速下降,chip-seq将成为研究基因表达调控和表观遗传学必不可少的工具之一。
染色质状态的重要意义:染色质的状态一方面通过改变核小体的位置,DNA的包装紧密程度直接影响着转录的进行,另一方面独特的组蛋白修饰将促进或抑制转录因子与调控元件的结合。系统性地研究不同细胞的染色质状态对于理解生命发育过程至关重要。
最早的chip-chip技术,是基于微阵列杂交原理的,旨在提供全基因组范围的DNA-蛋白质相互作用。在一个高密度的芯片上种有大量覆盖基因组或指定区域的探针。
二代测序的发展在多个领域得到了广泛应用,包括全基因组测序、RNA-seq、结构变异体的发现、DNase I超敏位点图谱、从mRNA转录本中鉴定融合基因、新的小RNA的鉴定等。
ChIP-seq的应用研究最早发表在2007年,感兴趣的DNA片段被直接测序而不是杂交。研究中比较关键的一点是技术的分辨率相比chip-chip得到了提高,以至于能够识别组蛋白变体比如H2A.Z。另外研究中还发现了一类二价染色质状态(bivalent domains),也就是同一染色质区域同时具有激活和抑制性组蛋白标记。这类标记所标记的基因可能预示着它们暂时处于沉默但随时准备开启转录的“蓄势”状态,且这类基因很可能对于细胞谱系的发展、命运决定起着关键性作用。
对于探究DNA结合蛋白,ChIP-seq的实验就是为了富集与特异蛋白结合的DNA。首先通过原位甲醛交联DNA和蛋白,接着超声打断DNA成200-600bp的小片段,用抗体免疫沉淀感兴趣的DNA-蛋白复合物。最后解交联,对释放的DNA进行测序。
对于探究核小体位置或者组蛋白修饰,常常用到微球菌核酸酶(MNase)消化直接使染色质片段化,不用甲醛交联操作。实际上超声也可以用来片段化,不过MNase更被广泛应用,因为它可以更彻底地去除不需要的linker DNA使核小体mapping更精确。不过既然是酶切片段就不可避免地会有很多难以控制的因素,比如酶本身的序列结合偏好、酶切活性等。根据ChIP实验是否需要交联分成X-ChIP和N-ChIP,X表示crosslinking,N表示native。
接下来的DNA建库需要对片段化的DNA片段进行大小筛选(一般是150–300bp范围)。
Cost是很久以前的数据,现在的成本已大大降低。
首先chip-chip的应用范围就会受到限制,因为不太可能每个物种都专门制备高覆盖度探针(覆盖度本身就是问题),探针数太多,生产耗时耗力,尤其是对于哺乳动物基因组更是困难。
杂交过程本身就带有很多bias,杂交效率难以准确衡量,会受到GC含量、片段长度、浓度、序列二级结构等影响。且杂交测定的范围也很大程度上受到限制。
ChIP-seq在解决chip-chip上述问题的同时自身也有一些局限性:二代测序的准确性在reads的尾端大幅度降低(不过可以通过优良的生物信息学算法校正),片段富集以及测序过程都有GC倾向,正确地在测序仪上loading适量的DNA等(太少了信号弱,覆盖度低;太多了荧光信号彼此干扰,数据质量差)。
是ChIP成功与否的关键因素,也是产生较大batch effect的来源。抗体的交叉反应活性应当被严格地检查,包括应用RNAi实验敲低进行特异组蛋白修饰的酶做验证、质谱检测沉淀下来的蛋白片段等。
典型的chip-seq实验要求10的7次方数量级的细胞,并产生10-100ng的DNA。有些chip-seq通过对protocol进行优化,降低到可以用10的4次方至10的5次方个细胞用来研究全基因组图谱。因为建库需要PCR扩增步骤,所以PCRbias是不可避免的(因此PCR循环数不能太高,尽可能低)。具体需要多少细胞和多少起始量DNA其实还要看研究的具体的TF或组蛋白修饰的丰度怎样。
DNA片段化的bias: 非均匀的片段化、染色质开放区更容易片段化造成。因此真正peaks calling需要对照,排除这类影响。
有三种常见的对照:
其中input DNA还是应用最为广泛的。
这个主要还是要根据样本本身的特点来确定,还可以检测一下saturation ponit
数据分析不是本文重点,简单提几个点:
鉴定peaks时,正链、负链的reads需要向彼此进行偏移,使得正负链的reads分布融合成一个中心区域的分布。(用的比较多的就是Poisson distribution)
有不同类型的peaks:sharp, broad and mixed,和检测的TF、组蛋白修饰类型本身的分布特点有关。对于不同类型的peaks,peak calling的算法会有区别。
peak caller的performance可以通过qPCR、计算peaks和邻近的motif之间的距离分布来简单评价。
下游分析不可缺少的当然是找motif,常用网站工具、软件包括:
motif之间的相关性可以反映潜在的基因调控网络。
peaks注释,相关性分析、聚类、GO分析也很常见。
ENCODE计划、modENCODE、Roadmap等表观遗传学项目都致力于大范围的基因组图谱的建立以及不同测序数据的整合。
参考文献:
ChIP–seq: advantages and challenges of a maturing technology
https://www.nature.com/articles/nrg2641
基因表达紊乱是癌症的一个主要标志。事实上,转录因子活动的改变已被证明是一些癌症最常见亚型的驱动因素。RNA对基因表达至关重要,无论是以蛋白编码RNA(mRNAs)的形式,还是以参与和调节转录的非编码RNA形式(lncRNAs或snRNA)、剪接(snRNAs)和翻译(核糖体RNAs、tRNAs和microRNAs)。 最近的证据表明,RNA的加工在癌症中被系统改变,证明RNA对肿瘤发生、生长和进展的重要影响。
2020年10月,来自澳大利亚的研究人员在《 Nature Reviews Cancer 》发表题为“RNA in cancer”的综述, 讨论了编码和非编码RNA的加工或活性改变如何促进肿瘤的发生、生长和进展,强调了RNA在癌症中的既定角色(miRNA和lncRNA)和新兴角色(选择性mRNA加工和circRNA)以及它们对癌症的作用机制。
一旦RNA聚合酶II合成了 mRNA ,它必须首先剪接并进一步加工成成熟的转录物,然后从细胞核输出到细胞质,转化为蛋白质。这些相互连接的处理步骤是由许多大分子复合物完成的,例如剪接体和转录-输出复合物TREX和TREX2。
在生理条件下,基因表达也可以通过一些 非编码RNA ,包括miRNAs、lncRNAs和circRNAs来调节。通常,miRNAs通过加速靶基因的去乙酰化和降解来负调控基因的表达,而lncRNAs则通过作为调节蛋白复合物的支架、定位到基因组DNA或改变基因组结构来调节顺式或反式的基因表达。
许多miRNAs被发现与癌症相关,要么作为肿瘤抑制因子,要么作为癌基因。
miRNA的作用: 人类细胞中大多数蛋白质的表达水平受到一个或多个miRNA的某种程度的调控。单个miRNA可以具有许多mRNA靶标,而单个mRNA可以被多个miRNA靶向。尽管miRNA可以共同作用,以抑制在3'非翻译区(UTR)中具有多个miRNA结合位点的靶标的表达,仅一种类型的miRNA与靶标mRNA的结合导致相对温和减少靶基因表达。通过RNA测序已经检测到1000多种不同的miRNA。一些miRNAs,如肿瘤抑制因子let-7,在几乎每种细胞类型中都有大量表达,而另一些miRNAs具有高度的细胞类型特异性表达,或者在某些细胞类型中以非常低的水平存在或不存在。因此在检测低表达的miRNAs的可能影响时,需要谨慎。
致癌和抑癌的miRNA:
1. 靶向致癌途径负调控因子的miRNAs在失调时可能通过多个靶点抑制RAS-MEK-ERK信号和miR-155/miR-221,它们分别针对SHIP1(也称为INPP5D)和PTEN,这两个都是AKT信号的负调节器。
2. 在癌症中最常见减少的miRNA是let-7 miRNA突变体,它通过靶向强效癌基因,包括MYC、KRAS和HMGA2作为主要的肿瘤抑制因子。因此,let-7 miRNAs被认为是一个重要的治疗靶标。
3. 大量miRNAs也被报道通过限制或逆转上皮-间质转化(EMT)来限制转移和/或化疗耐药,其中最有效的是miR-200家族。
miRNA失调的机制: miRNA基因由RNA聚合酶II转录,因此受到与蛋白质编码基因相同类型的表观遗传调控。事实上,许多miRNA基因都来自于蛋白质编码基因的内含子。在癌症中有许多关于miRNAs表观遗传失调的报道。 癌症中miRNA表达水平广泛下调的一种模式是源于缺氧诱导的癌细胞中Drosha和Dicer表达水平的降低 ,以及AGO2的磷酸化 ,进而降低了Dicer与AGO2并抑制miRNA从前体到成熟miRNA的加工。 然而,并不是所有的miRNAs都会受到缺氧的下调, 例如,miR-210的转录诱导可以覆盖缺氧诱导的加工减少,并且可以抑制免疫缺陷小鼠肿瘤生长的启动,但也可以促进细胞在肿瘤缺氧的应激环境中的适应和生存。 miRNAs下调的另一个机制可能是由于基因突变或前miRNAs转运蛋白exportin 5(XPO5)磷酸化水平的变化而减少核的输出。
lncRNAs已经被发现具有致癌或肿瘤抑制功能。
lncRNAs的作用: lncRNAs是指长度超过200个核苷酸不编码蛋白质的RNA。与mRNAs一样,它们由RNA聚合酶II转录,但与mRNAs不同, 许多lncRNAs优先定位于细胞核。它们具有不同的功能,包括核作用,如调节顺式或反式中的基因表达,调节剪接以及亚单位透明结构域的成核。2010年,lncRNA HOTAIR通过参与染色质重塑促进乳腺癌转移,随后发现许多lncRNA具有影响癌症发展或进展的功能。一些lncRNAs可能具有多种看似不相关的功能。 例如,lincRNA-p21最初被鉴定为p53诱导的肿瘤抑制因子lncRNA80,并被证明介导异质性核糖核蛋白K(HNRNPK)与其邻近基因CDKN1A(编码p21)的结合并增加其转录。
致癌和抑癌的lncRNA:
1. 最近的一项研究揭示了lncRNA-REG1CP在结直肠癌中的表达经常上调。REG1CP通过将解旋酶FANJ与相邻基因REG3A86的启动子连接,促进结直肠癌异种移植瘤的生长。
2. PCAT19是一种致癌的lncRNA,它激活反式基因,促进前列腺癌的生长、侵袭和转移。
3. 细胞质lncRNAs也可能是癌基因。在MYCN扩增的神经母细胞瘤中过度表达的lncRNA linc0255,通过与核糖体蛋白RPL35的相互作用特别激活E2F1的翻译。
4. lncRNAs也可以作为肿瘤抑制剂。核lncRNA DIRC3影响局部染色质结构,激活编码肿瘤抑制因子IGFBP5的邻近基因的转录。
5. lncRNAs也可以通过调节细胞质中的信号来抑制肿瘤。细胞质lncRNA-DRAIC在去势抵抗的晚期前列腺癌中下调,并通过干扰NF-κB激酶(IKK)活性抑制剂抑制核因子-κB(NF-κB)激活来抑制其进展。
6. 一些lncRNAs仍然有可能编码小蛋白。事实上,lncRNA LINC00908可以产生一种60个氨基酸的多肽,与正常组织样本相比,该多肽在三阴性乳腺癌组织中下调,并且与整体生存率差有关。
lncRNAs的多重对立效应: 关于lncRNA基因在癌症中的影响,最能说明问题的一个例子是考虑lncRNA基因在强效癌基因表达中的作用,也可能反映了MYC在驱动对增殖和生长信号的转录反应中所起的关键作用,MYC基因的转录受多个邻近lncRNA基因转录的调控。这也凸显了lncRNA基因座可以产生具有不同甚至相反功能的RNA。通过对小鼠体内大量MALAT1 lncRNA进行基因缺失研究的对比解释,进一步强调了lncRNA对基因表达影响的复杂性。
circRNA的新角色: circRNAs基本上在所有细胞和组织中都有表达,并且在癌症中可能被错误调节。circRNA主要是反向剪接事件的产物,它将外显子拼接到前一个外显子而不是下游外显子上,从而形成共价闭合的circRNA分子。有报道称, 一些circRNA位于细胞核内并调节转录,但大多数circRNAs位于细胞质中。 单个细胞可以表达数千个circRNAs,通过对患者肿瘤和癌细胞系RNA的深度测序,总共检测到超过200000个不同的circRNAs。 一些circRNAs被发现在癌症中与相应的正常组织相比过度表达,增加了它们作为疾病生物标志物的可能性。 circRNAs有可能作为癌基因或肿瘤抑制因子发挥作用, 可能是通过充当miRNAs的海绵,而一项敲除筛选表明,前列腺癌细胞中一些高度丰富的circRNAs对细胞的最大增殖至关重要,虽然还需要更多的工作来确定致癌或肿瘤抑制circRNAs。 circRNA可能还充当多蛋白复合物的核因子或组分。
失调的circRNAs: 什么导致癌症中的细胞周期失调?基因拷贝数或circRNA前体转录的改变无疑改变了它们在某些癌症中的水平。然而,由于大多数circRNAs是来自蛋白质编码基因的选择性剪接产物,因此需要仔细区分这些变化的影响与同源蛋白水平变化的影响。circRNA水平变化的另一种方式是通过参与circRNA生物合成的剪接因子水平的改变。
mRNA前体的剪接以去除内含子并以不同的方式连接外显子是基因表达的基础。事实上,选择性剪接可以通过产生选择性蛋白质亚型来促进转录组和蛋白质组的多样性。这个过程是由主要的剪接体完成的,它执行大多数的RNA剪接反应,并且与300多种不同的蛋白质相关。
一旦mRNAs被剪接和多聚腺苷酸化,它们必须从细胞核中的转录和加工部位输出到细胞质中进行翻译。有效的mRNA输出是通过将基因表达途径中的上游过程(即转录、剪接和多聚腺苷酸化)与mRNA输出耦合来实现的。mRNA不断地通过核孔复合体的内部通道运输,使蛋白质和分子能够穿过核膜。 转录、RNA剪接和多聚腺苷酸化与mRNA输出之间存在广泛的耦合,对肿瘤的发生具有重要意义。
mRNA剪接的新角色: mRNA剪接在历史上被认为是一个内控过程,对多外显子基因的表达至关重要,但最近的研究结果显示了RNA剪接机制的调控潜力。改变的mRNA剪接机制如何促进肿瘤的发生?SRSF2、SF3B1和U2AF1的突变都不同程度地影响3′剪接位点识别。这种改变的剪接可能会影响编码促进转化的蛋白质转录物的稳定性。
选择性裂解和聚腺苷酸化: 在肿瘤中也广泛观察到下游mRNA处理步骤的改变,如前体mRNAs的裂解和多聚腺苷酸化。例如,3′UTR区在肿瘤细胞系和肿瘤标本中均发生缩短。
选择性mRNA输出的新兴作用: 基因表达途径的末端步骤之一,mRNA的核输出,在癌症中也发生了改变。虽然mRNA输出被认为是基因表达中的一个普遍的、默认的途径,但是特定的生物途径可以通过选择性的mRNA输出来调节,使某些mRNAs优先于其他的。选择性mRNA输出可以调节对癌症发展至关重要的生物学过程,如细胞增殖和基因组完整性。这种mRNA输出机制的调节潜力可被癌细胞利用以维持增殖。
在过去的几年里,大量的研究已经非常详细地揭示了RNA在癌症中发生系统性改变的程度。癌症中编码和非编码RNA的广泛改变影响了肿瘤发生的多个方面。
这些不同的RNA亚型和处理它们的蛋白质参与癌症发生的机制特性,为治疗干预提供机会。例如,一些以核心剪接体机制为靶点的化合物,如与SF3B复合物结合的E7107,在体内影响RNA剪接,但在I期临床试验中静脉注射时表现出显著的毒性。最近的研究表明,在具有剪接体突变的晚期血液恶性肿瘤中,使用SF3B复合物H3B-8800的可口服调节剂,在耐受剂量良好的小鼠模型中显示了优先抗肿瘤活性。其他研究试图通过使用介导其蛋白酶体降解的化合物作为干扰剪接的替代药理学手段来调节选择性和调节性剪接因子,如RBM39,在小鼠急性髓系白血病模型中获得成功。RNA在癌症中的广泛改变将为治疗提供大量的新机会。进一步阐明RNA加工改变促进肿瘤发生、生长和进展的基本机制,对于确保癌症疗法专门针对RNA加工过程且对正常细胞的影响最小至关重要。
首发公号:国家基因库大数据平台
参考文献
Goodall, G.J., Wickramasinghe, V.O. RNA in cancer.?Nat Rev Cancer?(2020). https://doi.org/10.1038/s41568-020-00306-0.
本文地址:http://dadaojiayuan.com/jiankang/302327.html.
声明: 我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本站部分文字与图片资源来自于网络,转载是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们(管理员邮箱:douchuanxin@foxmail.com),情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!