NIH软件按需组装完整的基因组序列

2023-02-17 09:26:54冷酷的灯泡

国立卫生研究院的研究人员开发并发布了一种创新的软件工具,用于组装来自各种物种的真正完整(即无缝)的基因组序列。这种名为 Verkko 的软件在芬兰语中意为“网络”,它使组装完整基因组序列的过程更加经济实惠且易于使用。新软件的描述今天发表在Nature Biotechnology上。

NIH软件按需组装完整的基因组序列

Verkko 从组装第一个无间隙人类基因组序列中成长起来,该序列于去年由端粒到端粒 (T2T) 联盟完成,这是一个由国立卫生研究院下属的国家人类基因组研究所 (NHGRI) 资助的合作项目。

“我们利用了在 T2T 项目中学到的一切知识,并使流程自动化,”NHGRI 副研究员谢尔盖·科伦博士说,他领导了 Verkko 的创建,并且是该论文的资深作者。“现在有了 Verkko,我们基本上可以按下一个按钮并自动获得完整的基因组序列。”

T2T 联盟使用新的 DNA 测序技术和分析方法来生成和组装剩余的 8-10% 的人类基因组序列。然而,研究人员手动组装了这些碎片——这一过程需要这个庞大且技术精湛的团队花费数年时间才能完成。Verkko 可以在几天内完成同样的任务。

组装基因组序列就像拼拼图,不同的 DNA 测序技术会生成不同类型的基因组拼图。有些很小而且非常详细,而另一些虽然图像模糊但要大得多。Verkko 比较并组装了两种类型的作品,以生成完整而准确的图片。

Verkko 首先将细小的细节组合在一起,创建许多部分组装但不连续的序列片段。然后,Verkko 将组装的区域与更大、更不精确的部分进行比较。这些较大的部分作为一个框架来对更详细的区域进行排序。最终产品是准确完整的基因组序列。

研究人员使用人类和非人类基因组测序数据测试了 Verkko。该软件快速准确地组装了整个染色体的序列,这曾经是一项艰苦的壮举。

随着 Verkko 导致更完整的人类基因组序列,研究人员可以更好地评估人类基因组多样性。由于只有一个完整的人类基因组序列,科学家们目前缺乏对整个人类基因组许多部分多样性的了解,例如高度重复的 DNA 区域。

Verkko 还将加快努力,生成研究中常用物种的无缝基因组序列,例如小鼠、果蝇和斑马鱼,以提高它们对科学家的实用性。此外,从各种植物、动物和其他生物中生成无缝基因组序列将有助于比较基因组学,即研究不同物种基因组之间的异同。

“Verkko 可以民主化生成无缝基因组序列,”NHGRI 高级研究员 Adam Phillippy 博士说,他曾参与 T2T 项目和 Verkko 的开发。“这种新软件将使组装完整的基因组序列尽可能便宜和常规化。”

推荐阅读

阅读排行