新工具预测人类基因组短串联重复序列

2017-09-13 序说
0 0

new-method-identifies-tandem-repeats-associated-with-harmful-conditions-291625

日前,一项刊登在《自然 - 遗传学》(Nature Genetics)杂志上的研究称,来自 加州大学圣地亚哥分校 (UCSD)生物信息学的一队研究人员联合纽约基因组中心、哈佛大学和麻省理工学院共同开发了一种可分析人类基因组中短串联重复序列(short tandem repeats,STR)或称为微卫星(microsatellites)突变的工具。

STR 在研究 DNA 多态性标记过程中被发现,表现形式为 1~6 个核苷酸不断重复,有时多达数百或数千次。已知这些突变与大约 30 种人类状况有关,最著名的是亨廷顿氏病(又称亨廷顿舞蹈症),患者体内有超过 40 份拷贝的特定重复,拷贝数越多,越容易受疾病影响,病情越严重。

数十年来,《自然 - 遗传学》杂志一直跟踪报道人类基因组有害突变,串联重复序列往往是被忽视的一群,有时还被错认为 “垃圾 DNA”。以 UCSD 助理教授 Melissa Gymrek 为首的一些研究人员认为,串联重复序列可能是破解许多人类健康问题的关键,需要深入研究。

“当在人类基因组中寻找疾病信号时,一眼望过去,可选答案浩若繁星。我们正在寻找一种有效的方式来缩小答题范围,” 同时在医学院和工程学院任职的 Gymrek 说。

分析重复序列

在本文中,研究人员详细描述了他们所构建的数学模型,以此来预测人类基因组中重复序列的出现和突变频率。他们从 300 个独立个体基因组中获取了超过 150 万个重复序列。

在他们早期开发的能精确估计 Y 染色体中串联重复序列的 MUTEA 算法基础上,经改进后,这款新算法可用于分析成对的 DNA 变异(haplotypes,单倍型)。采用新算法分析后,研究人员发现,不同种类的突变不仅有规律可循,而且间隔时间可被预测,因此他们构建了所谓的 “分子钟”。利用分子钟,可确定突变在基因组内的突变频率。

寻找约束(constraint)

接下来,研究人员使用模型计算实际突变率,并与预期突变率进行比较。基因组中在生命早期产生严重健康状况的突变往往比预期的突变少,遗传学家将这种情况定义为高度被约束的。例如,患有自闭症的人不太可能会将他们的基因遗传给下一代。相反,例如亨廷顿氏病等导致生命后期发病的突变很可能会传给孩子,通常不受约束。

研究人员对一些早发型和晚发型疾病的重复序列套用了他们的模型。该模型正确地鉴定出了受约束的与早发条件有关的重复序列。

此外,他们还利用这个方法分析了一组非疾病相关重复序列,结果与预期一致,这些重复序列按照预期的速率发生变化并且不受约束。

接下来研究人员计划,用这款最新工具重新检查孤独症患者的家族基因组。

期刊参考

# 论文信息 引用次数 全文下载
1 Interpreting short tandem repeat variations in humans using mutational constraint 暂无下载

相关标签

参与讨论

使用匿名身份评论
  • 暂无评论,请抢占。