凭基因测长相?

2017-09-25 中国科学报
0 0

一阵疾风骤雨般的批评落到了基因测序先驱 Craig Venter 的一篇论文上,该文章宣布可以通过 DNA 预测人们的生理特征。但评审人员,甚至是该文章的一名共同作者却称,它过于夸大利用一个人的基因辨别个人特征的能力,可能会引发对基因隐私的不必要担忧。

在这篇 9 月 5 日发表于美国《国家科学院院刊》(PNAS)的文章中,Venter 及其位于加州旧金山人类长寿公司(HLI)的同事测量了 1061 名不同年龄和民族背景的参试者的全基因组。他们利用参试者的基因数据及其面孔的高质量三维照片,采用人工智能方法,在 DNA 序列中寻找叫作 SNPs 的微小差异,这些差异与诸如颧骨高度等面部特征存在关联。该团队还寻找了与一个人的身高、体重、年龄、声音特征和皮肤颜色等相关联因素的 SNPs。

该方法可在 74% 的情况下正确辨别出从 HLI 的数据库中随机选择的一组 10 人的个体特征。根据该文章,这些发现表明,执法机构、科学家和其他应用人类基因组的人应该审慎地保护基因组数据,以避免个人仅仅通过其 DNA 被辨识出来。“HLI 研究人员的一个核心观点是,在公开可获得的数据库中,并没有真正可以消除个人身份和完全隐私的东西。”HLI 在一份声明中说。

但其他分析过这篇文章的遗传学家则说,在他们看来,这一观点过于夸大。“我认为这篇文章并没有提高那些风险,因为他们并没有证明根据 DNA 识别一个人的任何能力。”宾夕法尼亚州立大学帕克分校人类学家 Mark Shriver 说。在一个随机选择的 10 人组中,他说,特别是在类似 HLI 的小而多样化的数据集中选择的一个小组,仅知道年龄、性别和种族等信息就能够排除绝大多数人。

为了证明这一点,纽约哥伦比亚大学计算生物学家 Yaniv Erlich 检查了 HLI 文章中的年龄、性别和种族数据。在 9 月份发表于预印本服务器 bioRxiv 的一项研究中,他计算认为,仅知道这 3 个特征就足以在 75% 的情况下在 HLI 的数据集中辨识出 10 人组中的某个人。Erlich 表示,而且根本没有必要知道这些人基因组的任何信息。此外,他表示,HLI 的 SNPs 面部结构重建并不是非常具体,他们倾向于将一个人的个人特征看得和任何人的性别与种族差不多。

在发表于 PNAS 之前,该文章曾被递交到《科学》,该期刊评审过该文章的审稿人 Shriver 说。他表示,HLI 的真实数据是合理的,他对该团队通过测量染色体终端(会随着时间发展而变短)决定年龄的新方法印象非常深刻。但他表示,该文章并未像其主张的那样,证明个体特征能够通过 DNA 来识别。“我认为它完全歪曲了他们所做的和他们所发现的。”他说。

HLI 称,该文章已陈述利用了多个参数,而个人面部特征仅是其一,基于 1000 多个基因组的工作来识别一个人的特征是可能的。“它预示这样的预测将会更加精准。”HLI 发言人 Heather Kowalski 说。HLI 表示,它坚持自己的方法论,不过同时承认样本集确实规模较小。该公司在 9 月 11 日对 Erlich 的文章作了回应。

Shriver 说,他和 Erlich 在《科学》论文评审中向研究作者指明了他们的担心。Shriver 和 Erlich 均表示,该期刊最终拒绝了这一稿件。(《科学》并未对未发表的研究做过评论)该文章随后被提交给 PNAS,并让像 Venter 一样的一位美国国家科学、工程和医学院成员选择审稿人。其中两位审稿人是信息隐私专家,另外一位是一名生物伦理学家。

PNAS 确认,Venter 选择了该研究的所有 3 位审稿人。HLI 拒绝对 PNAS 就该文章的评审过程做出评论。

该论文共同作者、现在新加坡苹果公司工作的计算生物学家 Jason Piper 同意,该文章完全不恰当地代表了他和其他共同作者所做出的发现。Piper 补充说,他和该公司签订的合同免去了文章被递交时让他批准该文章初稿的权利,并让 HLI 提供该公司认为适当的数据。作为回应,HLI 确认“作者有机会评审并对文章做出评论”。

Piper 随后在推特网上痛批该文章,并表示在他看来,HLI 在鼓励有限制地获取 DNA 数据库时有着潜在的利益冲突。HLI 作为一家营利性公司,在设法建立世界上最大的人类基因组信息数据库。

“我认为基因隐私非常重要,但这里采取的方法却是错误的。”Piper 说,“为了从基因组中获得更多信息,人们不得不分享。”他说,一个更加有用的途径是找到一个让基因组数据公开但却不允许识别个人的方法。

作为对该论文批评声音的回应,HLI 公司在一份声明中表示:“HLI 支持保护基因组数据和提升数据交换的现代解决方法。”它补充称,该文章旨在引起对如何共享遗传信息且同时保护个人隐私的讨论。

尽管如此,Erlich 依然担心 Venter 的身份依然让该文章在政策制定者眼中有了更多的分量,使他们对 DNA 隐私变得过分关注。“现在的新规则和管理制度正是基于类似的文章。”他说,“当我们在应对隐私风险时,获得正确的事实非常重要。”

相关标签

  • 基因检测

    基因检测

    基因检测是通过血液、其他体液或细胞对 DNA 进行检测的技术,是取被检测者脱落的口腔黏膜细胞或其他组织细胞,扩增其基因信息后,通过特定设备对被检测者细胞中的 DNA 分子信息作检测,预知身体患疾病的风险,分析它所含有的各种基因情况,使人们能了解自己的基因信息,通过改善生活环境和习惯,避免或延缓疾病的发生。

  • 人工智能

    人工智能

    人工智能(英语:Artificial Intelligence, AI)亦称机器智能,是指由人工制造出来的系统所表现出来的智能。通常人工智能是指通过普通电脑实现的智能。该词同时也指研究这样的智能系统是否能够实现,以及如何实现的科学领域。 一般教材中的定义领域是“智能主体(intelligent agent)的研究与设计”,智能主体是指一个可以观察周遭环境并作出行动以达致目标的系统。约翰·麦卡锡于 1955 年的定义是“制造智能机器的科学与工程。” 人工智能的研究是高度技术性和专业的,各分支领域都是深入且各不相通的,因而涉及范围极广。 人工智能的研究可以分为几个技术问题。其分支领域主要集中在解决具体问题,其中之一是,如何使用各种不同的工具完成特定的应用程序。AI 的核心问题包括推理、知识、规划、学习、交流、感知、移动和操作物体的能力等。强人工智能目前仍然是该领域的长远目标。[7] 目前比较流行的方法包括统计方法,计算智能和传统意义的 AI。目前有大量的工具应用了人工智能,其中包括搜索和数学优化、逻辑推演。而基于仿生学、认知心理学,以及基于概率论和经济学的算法等等也在逐步探索当中。

  • 生物识别

    生物识别

    生物识别技术主要是指通过人类生物特征进行身份认证的一种技术,这里的生物特征通常具有唯一的(与他人不同)、可以测量或可自动识别和验证、遗传性或终身不变等特点。所谓生物识别的核心在于如何获取这些生物特征,并将之转换为数字信息,存储于计算机中,利用可靠的匹配算法来完成验证与识别个人身份的过程。

参与讨论

使用匿名身份评论
  • 暂无评论,请抢占。