一项关于人类基因组外显子组(蛋白质编码区)的深度分析提供了迄今为止有关该区域最全面的遗传变异记录。登上本周《自然》杂志封面的研究 Analysis of protein-coding genetic variation in 60,706 humans 被认为有助于从临床发现与人类疾病相关的遗传变异。
来自哈佛-麻省理工博德研究所,参与人类外显子组整合数据库(ExAC)项目的 Daniel MacArthur 及同事分析了来自60,706位被试者的外显子组测序数据,这些被试者来自于不同的地理人口系谱,包括欧洲、非洲、南亚、东亚和拉美人口。他们发现了约740万个遗传子多态(genetic variants),对于人类低频蛋白质编码多态的分析,其分辨率达到前所未有的程度。
作者通过分析该数据集来表征全球遗传变异的模式,在较小的遗传变异数据集上达到了此前无法实现的分辨率。遗传变异密度令研究人员得以在同一位点分辨多重序列多态(多等位基因多态),而数据集的规模则令研究人员得以首次获得一些有关复发突变的发现,复发突变指的是罕见突变在各人口历史中独立发生。
ExAC提供了一个可公开获取的参照数据库,事实已经证明这是一个有用的临床工具,可用于评估潜在的孟德尔遗传病(单基因病)的致病基因多态,其中一些多态在人口中的普遍程度令人难以置信。作者分析了过往研究所报告的192个此类多态,结果发现仅9个有充足的数据表明其与疾病相关。
在另外一篇发表在Genetics in Medicine的论文 Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples 中,伦敦帝国理工学院的Roddy Walsh 及同事评估了最常见的严重的孟德尔病之一 — 心肌症(心肌疾病)的遗传变异情况。他们的发现表明,此前认为与特定心肌症相关的许多基因和基因多态可能并没有真的关系,不过现在利用ExAC可以显着改进对基因变体的解读。
在发表在Nature Genetics上的另外一篇论文 Patterns of genic intolerance of rare copy number variation in 59,898 human exomes中,西奈山伊坎医学院的 Douglas Ruderfer 及同事分析了ExAC数据集内罕见的拷贝数变异(一种基因组结构变异)。
一直有研究设法记录外显子组内的遗传变异,而ExAC是其中规模最大最全面的一个项目。在伴随的新闻与观点版块中,西雅图华盛顿大学的 Jay Shendure 总结说:“ExAC既是一项技术成就,也是一项政治成就,不仅有数据争议,也有研究者、审批许可和14余项研究的角力 — 主要针对的是各种常见疾病的遗传问题。”