研究人员使用全转录组制作出首个用于RNA测序分析的工具包

2023-01-17 14:28:07冷酷的灯泡

分析一个人的基因表达需要将他们的RNA景观映射到标准参考,以深入了解基因“开启”和在体内发挥功能的程度。但是,当参考没有提供足够的信息来进行准确映射时,研究人员可能会遇到问题,这个问题被称为参考偏差。

研究人员使用全转录组制作出首个用于RNA测序分析的工具包

在《自然方法》杂志上发表的一篇新论文中,加州大学圣克鲁斯分校的研究人员介绍了有史以来第一种使用“泛转录组”分析全基因组RNA测序数据的方法,该方法结合了转录组和泛基因组——包含遗传物质的参考来自一群不同的个体,而不仅仅是一个线性链。

由UCSC生物分子工程副教授BenedictPaten领导的一组科学家发布了一个工具包,允许研究人员将个人的RNA数据映射到更丰富的参考,解决参考偏差并导致更准确的映射。

“这是泛基因组加转录组——这种组合以前从未真正完成过,”该论文的共同第一作者、UCSC计算基因组学实验室的博士后学者JordanEizenga说。“这是第一次有人尝试将泛基因组纳入RNA测序图谱的标准特征。”

该工具将帮助世界各地致力于通过RNA测序分析了解基因表达的研究人员。这些工具是公开可用的,可以通过Github访问。

“通过这个工具包,我们正在使用我们现在可以从泛基因组中获得的更多样化的数据来改进基因表达数据的测量,这在个体之间可能存在很大差异,”Paten说。“目的是让这种更多样化的数据对正在研究基因表达的研究产生影响,从而更好地分析细胞模型、类器官模型和其他研究应用。”

RNA最普遍认可的功能是将DNA转化为蛋白质,但科学家们现在了解到,绝大多数RNA是非编码的,不会制造蛋白质,而是可以发挥影响细胞结构或调节基因等作用。整个RNA景观统称为转录组,对其进行映射可以让研究人员更好地了解个体的基因表达。

泛转录组建立在基因组学领域中新兴的“泛基因组学”概念之上。通常,在评估个体基因组数据的变异时,科学家会将个体的基因组与由单条线性DNA碱基链组成的参考基因组进行比较。使用泛基因组可以让研究人员同时将个体的基因组与遗传多样性的参考序列队列进行比较,这些参考序列来自代表生物地理祖先多样性的个体。这为科学家们提供了更多的比较点,以便更好地了解个体的基因组变异。

映射RNA测序数据以了解基因表达可能很困难,因为RNA序列是由细胞机制拼接的,这意味着一组RNA数据可能来自基因组的非连接区域,这使得将它们与参考正确对齐变得具有挑战性。这些剪接位点在人群中并不统一,而是因人而异。也很难知道RNA来自哪种单倍型——这组基因是特异地来自从个体母亲遗传的染色体组,还是从父亲遗传的染色体组。

但是利用新的开源工具管道,研究人员可以获取个体RNA的拼接片段,绘制它们在泛基因组上的对齐位置,确定数据属于哪种单倍型,并分析基因表达。

首先,管道识别RNA测序数据来自基因组的哪些区域,包括剪接位点,并在泛基因组参考上标记这些点。然后将这些标记点与泛转录组进行比较,该转录组由泛基因组中包含的参考数据生成的单倍型特异性转录本组成。这一步需要专门的、具有挑战性的算法方法。

最后,它根据映射数据和泛转录组中的转录本之间的这种比较生成基因表达水平的估计值,并确定基因来自哪些单倍型。

“这绝对是一项非常具有前瞻性的研究,因为其他全基因组表达方法尚未真正利用泛基因组和单倍型信息,”该研究的共同第一作者、UCSC计算基因组学实验室前博士后学者JonasSibbesen说。现在是哥本哈根大学的助理教授。“我们现在正在考虑泛基因组学可能在转录组分析中额外带来什么。”

展望未来,研究人员有兴趣进一步开发这些工具以用于下游信息学分析,并针对单细胞数据研究的特殊性定制工具。目前,该小组希望他们的新工具包能够展示使用泛基因组学衍生分析的有用性。

“我们需要能够向一些研究人员解释泛基因组参考将如何使他们受益,”Paten说。“对于RNA、功能数据和表达数据,这条管道真的是第一次尝试。”

推荐阅读

阅读排行