大数据分析确定新的癌症风险基因

2018-07-12 序说
0 0

许多遗传因素都会导致癌症,有些突变来自你的父母,有些是从其他外因或你自身 DNA 复制来的。大规模基因组测序已经有能力区分体细胞突变(somatic mutations)所引起的癌症,但是在鉴定哪些癌症可能来自父母遗传变异方面并没有那么有效。目前,我们对这类癌症相关突变的了解仍基于几个关键的家族研究。

DNA_Credit_Jonathan Bailey_NHGRI

现在,巴塞罗那基因组调控中心(CRG)的一组研究人员在 Ben Lehner 教授的领导下开发了一种新统计方法——从肿瘤基因组测序大数据中,提取癌症易感性基因。相关研究论文 刊登 在了《Nature Communications》杂志上。

论文第一作者、CRG 博后研究员 Solip Park 解释道:“我们的计算方法源于一个古老的想法,即癌症基因在导致癌症之前需要‘出击 2 次’。”

该方法允许研究人员在缺乏控制样本的情况下找到风险变量,也就是说,他们不需要将癌症患者与健康人群进行比较。“这是一个检测新癌症易感性基因的有力工具,”Park 说。

,该方法被命名为 ALFRED,研究人员利用它鉴定出了 13 个癌症易感性候选基因,其中 10 个是全新的。我们将 ALFRED 套用于来自 30 种不同肿瘤类型的 10000 多个癌症患者的基因组,成功找到了已知的和未知的导致癌症风险的潜在癌症易感性基因,Ben Lehner 说。

“新发现的癌症易感性基因对许多类型癌症可能都具有重要作用,例如它们与 14% 的卵巢肿瘤、7% 的乳腺癌肿瘤和 2% 的所有癌症都有关联。其中,一个新发现的继承变异风险基因‘NSD1’可能影响着 3‰的癌症患者,”基因组数据科学实验室组长 Fran Supek 解释。

研究人员采用的是来自世界各地的癌症研究基因组数据,包括 TCGA(癌症基因组地图)项目,以及其他与癌症无关的几个项目。经过测试,这种新方法可以提高我们对癌症基因组学的理解,并利用公共数据进一步促进癌症研究、诊断和治疗。

“这项工作强调了共享基因组数据的重要性。应用新计算方法就能识别先前从未发现的重要癌症基因。只有比较跨医院、国家和疾病的数据资源,我们才能深入了解常见和罕见疾病。遗憾的是,许多研究者仍不愿意分享他们的数据,这是需要积极改变的社会现状。”

期刊参考

# 论文信息 引用次数 全文下载
1 Systematic discovery of germline cancer predisposition genes through the identification of somatic second hits 暂无下载

相关标签

  • 癌症基因

    癌症基因

    细胞分裂是由一系列严密控制的流程来完成的。这些流程取决于一些基因的正常转录(transcription)与翻译(translation)。如果这些流程出现异常,则可导致细胞生长的失控。现在认为,人类基因组大约有 30,000 个基因,其中少部分基因似乎在肿瘤的预防、发生与进展方面起着十分重要的作用。在许多不同类型的恶性肿瘤中,这些基因出现功能异常或功能丧失。 对于已鉴别出的基因,可根据它们在细胞中的正常功能,分为如下两大类: 第一类基因是它们的蛋白质产物能刺激或提高细胞的分裂能力与生存能力。这一类基因还包括那些能抑制细胞死亡从而在肿瘤生长上起了一定作用的基因。 第二类基因是它们的蛋白质产物能直接或间接阻止细胞分裂或导致细胞死亡。 第一类基因的正常“版本”叫做原癌基因(proto-oncogenes)。然而,这类基因的“突变” 版本或“受损”版本则成了癌基因(oncogenes)。 第二类基因可叫做肿瘤抑制基因(tumor suppressors)。

  • 基因大数据

    基因大数据

    暂无简介

参与讨论

使用匿名身份评论
  • 暂无评论,请抢占。