世界上最大的人类基因组序列向科学家开放

2023-12-03 12:40:53深情的哈密瓜

英国生物银行——健康、基因组和其他生物数据的存储库——今天发布了数据库中50万英国志愿者的完整基因组序列。世界各地的研究人员可以申请访问这些缺乏可识别细节的数据,并利用它们来探索健康和疾病的遗传基础。

世界上最大的人类基因组序列向科学家开放

“科学家们正在像谷歌地图一样看待这个问题,”英国生物银行首席执行官罗里·柯林斯在新闻发布会上说。“当他们想知道从生活方式、环境、遗传学到疾病的途径是什么时,他们不会去谷歌,而是去英国生物银行。”

继2021年发布200,000名生物银行参与者的全基因组之后,今天的财富发布了每位英国生物银行参与者的完整30亿个字母的基因组序列。这项耗资2亿英镑(2.5亿美元)的工作由生物医学研究资助机构Wellcome、英国政府和几家制药公司资助,作为回报,这些公司在数据广泛发布前9个月获得了这些数据。

此前,英国生物银行的遗传信息包括整个“外显子组”——每个外显子组是编码蛋白质的基因组的2%——在此之前,还包括分布在整个基因组中的850,000个常见的单字母DNA变体。后者信息为连接健康和遗传学的全基因组关联研究(GWAS)提供了动力。

稀有变体

但是,当研究人员寻找遗传学与疾病或其他性状之间的关联时,大多数“命中”出现在基因组的非编码区域中,这些区域在外显子组序列中缺失,并且在现有全基因组数据中仅以低分辨率覆盖。英国埃克塞特大学的人类遗传学家MichaelWeedon表示,整个基因组还使研究人员能够发现非常罕见的突变,这些突变对性状的影响往往比全基因组数据中包含的常见变异更大。“我们希望罕见的变异能让我们对生物学有更多的了解。”

事实已经证明确实如此。在11月20日的预印本1中,Weedon和同样来自埃克塞特的人类遗传学家GarethHawkes领导的团队挖掘了英国生物银行数据中的前200,000个完整基因组,发现了29个罕见的DNA变体,这些变体与高达7的身高差异有关。厘米;这些变异在之前的基因研究中并未被发现。Weedon说,这项研究是分析所有500,000个基因组的试点,他计划花一天时间首先查看基因组数据。

Weedon表示,最终,研究人员将需要超过50万个完整基因组来全面绘制罕见基因变异与健康之间的关联图谱。“我认为这是获取我们可能需要的数百万样本的良好下一步。”

疾病链接

这些数字即将到来。由美国政府资助的“我们所有人”研究计划最终发布来自100万或更多美国人口的全基因组和健康数据。该项目已经发布了250,000个基因组,但直到8月份才开始接受非美国研究人员的数据研究申请。研究人员表示,“我们所有人”等数据库也将有助于确认与英国生物银行发现的联系。

赫尔辛基大学统计遗传学家AndreaGanna根据从英国生物银行前200,000个基因组中了解到的信息,尚不相信它们能带来多大的经济效益。Weedon和Hawkes等全基因组研究发现的许多非编码变异接近通过GWAS发现的命中结果。尽管如此,完整的基因组序列可能有助于研究人员更准确地绘制疾病与结构变异(缺失、额外或翻转的DNA块)之间的联系,Ganna说。

柯林斯说,英国生物银行已经发布了9,000多种出版物,最新版本的真正影响可能在一段时间内尚不清楚。“我想我们会惊讶地发现有多少结果是我们从未想象过的。”

doi:https://doi.org/10.1038/d41586-023-03763-3

推荐阅读

阅读排行