新起点
肿瘤基因组学
2020-05-09 12:54:24

肿瘤基因组学(英语:oncogenomics)又称癌症基因组学(英语:cancer genomics)是基因组学中一门新兴的子学科,主要是通过高通量测序技术来将基因与癌症关联起来的学问。肿瘤是一种由 DNA 变异不断累积而导致细胞发生不受控激增并形成新生物的疾病。肿瘤基因组学的主要目标是通过鉴定新的原癌基因或者抑癌基因来为肿瘤诊断、肿瘤临床结果预测和肿瘤靶标治疗提供新的方法。肿瘤基因组学的应用导致了诸如伊马替尼、曲妥珠单抗和安维汀等的肿瘤靶标治疗的成功。

除了理解和找出肿瘤产生和发展的遗传学机制外,肿瘤基因组学最主要的目的是为了开发肿瘤个性化治疗的方法。肿瘤的产生是由于 DNA 变异的累积。但这些变异是随机产生的,甚至在相同类型的肿瘤个体间变异的种类和组合都不相同。所以能够识别和定位病人个体的独特变异可能会提高肿瘤的治疗效果。

人类基因组计划的完成在很大程度上加速了肿瘤基因组学的发展,让研究人员可以更容易的定位引起肿瘤的基因。另外,测序技术的发展也让研究院可以获取基因测序数据,研究肿瘤基因组学的测序数据分析方法也逐步建立起来。随着大量的肿瘤基因组学研究工作的展开和随之而来的大量变异数据的积累,预计在十年后引起肿瘤的主要变异、重排和表达水平差异都会被较好的描述和记录下来。肿瘤研究不会仅仅关注基因组水平的变异,同时还会关注表观遗传水平上的甲基化和组蛋白修饰变化,转录组上的基因表达差异或者蛋白组上的肿瘤细胞的蛋白浓度和功能情况。总之,肿瘤基因组学专注在研究肿瘤细胞在基因组,表观组和转录组水平的变化。

随着20世纪90年代很多组织DNA序列的测定,基因组学逐渐建立起来。到了21世纪,人类基因组计划在威康信托基金会桑格研究所(英语:Wellcome Trust Sanger Institute)的完成为很多在基因组功能和疾病基因方面的研究铺平了大道。肿瘤便是是其中的主要研究对象之一。

为什么能够进行肿瘤基因组测序对肿瘤研究至关重要的原因有如下几点:

在2008年第一个肿瘤基因组由Timothy J. Ley 测出。 这次研究测序了一个典型急性髓性白血病患者的肿瘤基因组以及病人表皮的正常细胞基因组。研究人员通过对肿瘤和正常基因组测序数据的比较找到了10个基因包含了如下变异:

以上这些基因都位于促进肿瘤发生的通路中,但在本次研究之前,基于肿瘤基因的优先考虑,它们中的多数都不会被选作治疗的靶向基因。所以本次研究的结果也展示了用肿瘤全基因组测序技术来鉴定体细胞突变的重要性,以及对病人正常基因组的平行测序来确定哪些突变/变异是遗传的,哪些是获得的。这项技术在鉴定真正的体细胞突变方面十分重要。

癌症细胞的基因组与转录组的研究以下面先端技术为基石。

另外,转率组各种可能的可变剪切结果的相对大小也成为肿瘤研究的重要组成:科学家已发现某些剪切形式与特定的癌症类型相关。在这种发现的影响下,得以量化可变剪切形式的新世代外显子阵列技术与其他转录组测序技术已成为肿瘤基因组学的重要部分。

在测序与表达数据量逐渐增大的现在,生物信息学的发展已成为关键。另外,在各种肿瘤基因已经被发现的现在,对于这些基因的功能描述与这些基因整体如何产生癌症表型的研究仍未完成。举例来说,检验肿瘤基因的转化能力即可确认这些肿瘤基因对于肿瘤形成有作用。另外,肿瘤细胞有各种 DNA 突变,找出哪些基因在肿瘤形成与发展的早期有关键作用也是件重要的研究工作。在这些基因中找到突变会是未来癌症诊断并找出治疗方法中最关键的步骤。

肿瘤基因组学中的操纵子组研究是将基因组、转录组、蛋白质组结合,以得到肿瘤发展的完整分子机制为目标的一种方向 。操纵子组研究同时对肿瘤组织样本里的 DNA、RNA 与蛋白质进行分析,会是各种分析肿瘤细胞的技术不断积累、进步之后,往后癌症研究的最终目标。

比较肿瘤基因组学是肿瘤基因组学的一个分支,比较肿瘤基因组学通过跨物种的基因组比较来鉴别癌基因。这种研究包括对其他模式生物(如小鼠)的肿瘤基因组、转录组和蛋白组的研究,从而鉴别潜在的癌基因,然后将研究结果转化到研究人类肿瘤样本中,来鉴别这些基因的人类的同源基因在人类肿瘤发生扮演者重要的角色。最近的研究发现小鼠模型中基因突变与人类肿瘤相似。肿瘤基因组学的这一支可以将对某些模式动物的研究成果应用到其他物种中。这些模型通过多种方法产生,包括逆转录病毒引发的基因突变和癌细胞的转移种植。比较肿瘤基因组学是癌基因鉴别的一个好方法。

肿瘤基因组学研究的一个方向是通过利用肿瘤细胞的基因突变这一异常来制造有效的肿瘤的治疗方法,这以方向展示了良好的前景。是合成针对肿瘤基因突变位点的药物。常见的癌基因可能对所有细胞(不仅是肿瘤细胞)的生存都至关重要。所以,针对这些基因的药物可能产生强烈的副作用,比如肿瘤化疗药物可能直接引发其他严重疾病。为了制造更加安全的肿瘤靶向药物,科学家现在系统性地评估抑制人类基因组中每一个基因的影响——每次抑制一个基因与研究认为为癌基因的突变结合。 这种研究通过利用仅存于肿瘤细胞的突变寻找肿瘤的靶向疗法。如果敲除那些对于正常细胞是无用或影响很小,而对携带了给定癌基因的肿瘤细胞是致命的基因,那么这些非必需基因在人类整体的抑制可以摧毁肿瘤细胞,同时最大程度的保护正常细胞。(这里的“合成药物”即描述了这种协同效应)在寻找肿瘤靶点和开发药物中这种方法已经初见成效。比如:PARP-1抑制剂可以靶向地针对BRCA1/BRCA2相关肿瘤。在这个例子中,PARP-1的抑制和肿瘤相关的BRCA基因突变同时出现对这些肿瘤细胞是致命的。这项技术的临床Ⅰ期试验表明此方法有希望应用于BRCA1或BRCA2突变的患者。临床Ⅱ期实验现在正在进行中。

大量存有肿瘤基因组数据的数据库可供肿瘤研究者使用。肿瘤基因计划就是这样的一项为了发现肿瘤细胞内基因内的突变的计划。为了达成这一目标,他们为原发肿瘤和肿瘤细胞系的外显子和flanking splice junctions进行测序。这些研究数据展示,存储在COSMIC。截至到2008年2月,肿瘤基因计划在1848个肿瘤标本中发现4746个基因和2985个突变。美国肿瘤研究院下属的Cancer Genome Anatomy Project|肿瘤基因组图谱计划也存储了大量肿瘤基因组、转录组和蛋白组的研究数据。Progenetix是另一个癌细胞参考数据库,其展示了肿瘤的细胞遗产学和细胞分子遗传学。Oncomine有编辑整理过的肿瘤转录组数据。肿瘤基因组学综合数据库(The Integrative Oncogenomics database IntOGen,IntOGen)整合了用组织分类的多维的人类肿瘤基因组学数据,其中组织名符合ICD-O命名规范。。IntOGen database使不同变异类型(如基因表达,CNV)的数据挖掘称为可能。国际肿瘤基因组联盟(International Cancer Genome Consortium )是目前收集人类肿瘤基因组数据的最大的项目。这些数据可以通过ICGC website访问。BioExpress® Oncology Suite有原发性肿瘤、转移性肿瘤、良性肿瘤和正常组织(包括癌旁组织)的基因表达数据。这个数据库包含了非常有价值的血液细胞恶性肿瘤样本。针对模式生物的数据库一样存在,比如Retrovirus Tagged Cancer Gene Database (RTCGD)收录了大鼠肿瘤中逆转录病毒和转座子插入引发的基因突变。

整个基因家族的突变研究已经成为肿瘤基因组学的一个强大的工具,这带来了很多的进展。可以通过相似的序列和蛋白结构域来判定基因家族,同一个基因家族的基因拥有相似的功能,经过系统性地对肿瘤基因组中的这些基因测序,可以发现与肿瘤发生相关的信号通路。已经研究过的这种基因家族是蛋白激酶家族(其作用是给蛋白质添加磷酸基团)和磷酸酶基因家族(其作用是移除蛋白质的磷酸基团)。这些基因家族被首先研究是因为其参与了细胞生长和死亡的信号传导。特别的,超过50%的结直肠癌中可发现超过一种磷酸激酶或磷酸酶突变。结直肠癌、乳腺癌、胃癌、肺癌和其他多种癌症的基因突变常见于PIK3CA(Phosphatidylinositold 3-kinases)基因。多种开发中的药物就是抑制PIK3CA。另一个例子是2004年发现的BRFA基因,这是发现与黑色素瘤相关的第一个基因。BRAF编码了丝苏氨酸激酶(其参与了RAS-RAF-MAPK信号通路),他们发现BRAF的突变将导致组合磷酸化和活性变化,这在59%的黑色素瘤都可发现。BRAF发现之前,黑色素瘤的发生发展的遗传学原理,所以,患者的预后很差。之后CGP开始研究黑色素瘤的相关基因,最后,他们发现BRAF,现在BRAF是肿瘤治疗的新靶点,已有相关临床研究数据。

最近研究发现,线粒体DNA突变和肿瘤的发生之间存在着一定联系。以下是四种已被鉴定的线粒体DNA突变类型:

在癌细胞线粒体DNA的编码区及非编码区都已被观察到点突变的存在。在膀胱癌、头颈癌和肺癌患者中,编码区的点突变表现出了同质性(与其他患者相似)。这预示着,当一个正常细胞转化为癌细胞时(例如经历致瘤性转化),其线粒体是向着相同方向变化的。另一方面,非编码区的点突变也表现出了一致性。癌细胞线粒体的DNA控制区的突变可能也是某些肿瘤中的重要特征。

由于突变区域较小( < 1kb ),缺失突变被检测到的频率并不高。在多种癌症中发生的某些特定的线粒体DNA突变 ( 如线粒体复合物1的亚基基因ND1上发生的264-bp缺失及66-bp 缺失 ) 预示着小型的线粒体DNA缺失可能发生在肿瘤发生的早期。这也预示着,随着肿瘤发生的进行,包含这些缺失突变的线粒体的数量会逐渐升高。然而这也是存在例外情况的。经研究发现,一种相对较大的碱基序列缺失发生在多数癌症中 ( 被称为"常见缺失" ),但一般来说正常细胞中的线粒体DNA大规模缺失是要比肿瘤细胞更多的。我们认为肿瘤细胞中可能存在一种自适应过程,它会把那些包含大规模缺失的线粒体给消除掉 (“常见缺失”的长度大于4kb)。

经研究发现,两种小型的线粒体DNA插入突变( 约为~260及~520bp )存在于 乳腺癌、胃癌、肝细胞癌(HCC)和结肠癌中,但该突变在正常细胞中也被发现。 因而这些插入突变和癌症间的关系还有待确认。

通过实时PCR法检测,多种癌症细胞的线粒体DNA比正常细胞来说存在更多的线粒体DNA拷贝数变异。拷贝数的增加被认为是由氧化应激引起的,而拷贝数的减少的原因被认为有如下几种:重链复制起始位点的体细胞点突变,线粒体DNA控制区中D310多聚C-stretch序列的体细胞点突变,p53( 抑癌基因 )调控通路的突变,以及POLG(线粒体DNA聚合酶)突变引起的酶活性低下。尽管线粒体DNA拷贝数存在增加或减少,但其在肿瘤细胞间确实是维持一致的。跟正常细胞相比,肿瘤细胞线粒体DNA拷贝数的一致性表明在肿瘤细胞中,为了控制线粒体DNA的数量存在更为复杂的系统,而不是简单地随着异常细胞的增值就发生了改变。线粒体DNA含量被认为在某些特殊的人类肿瘤类型或位点上有着某种程度的特异性。

关于表格: 多种癌症中的线粒体DNA突变。 该表格仅包含部分癌症类型。以上研究中有一个是着眼于不同癌症中的点突变位置,包含了867个癌症患者、23种癌症类型。 57.7% (500/867)的癌症含有体细胞点突变,而这些1172个突变中有37.8% (443/1127) 位于线粒体DNA控制区,13.1% (154/1172)位于tRNA或rRNA基因,49.1% (575/1127) 位于负责产生与线粒体呼吸作用有关的复合物的mRNA基因上。

目前已有线粒体DNA靶向的抗肿瘤药物并在杀死肿瘤细胞方面有其效果,而以线粒体突变为生物标记来提供治疗手段的研究也有一定成果。相比核DNA突变,线粒体DNA突变更容易作为靶标,因为线粒体基因组较小因而更容易找出特异性突变。另外也有人认为,血液样本中可检测到的线粒体DNA数量变异也可用作标记物,可用来预测个体的癌症易感程度以及判定恶性肿瘤发生阶段。除了以上这些特性外,线粒体DNA的不受细胞周期控制,在产生ATP及维持线粒体稳态方面都非常重要,的这些特性使得靶向线粒体DNA成为一个可行的治疗策略。

随着该领域的发展,科学家正在发掘可用于肿瘤发生阶段判定、治疗、预后的潜在标志物。目前已有许多生物标志物可用于上述目的,比如单核苷酸多态性(SNPs),染色体畸变,DNA拷贝数变异,微卫星不稳定性,启动子区域差异甲基化,甚至是高/低蛋白表达水平。这些特性与各种癌症的关系的确定将有可能帮助我们通过开发靶向特异标志物的药物来提供更多有效的个性化治疗选择。如果想了解一些癌症及其各自生物标志物的信息的话,请点击肿瘤标志物页面。

网站公告: