机器学习可以帮助揭示大型强子对撞机数据中未被发现的粒子

2024-04-16 09:09:27深情的哈密瓜

科学家们使用神经网络(一种受大脑启发的机器学习算法)来筛选大量粒子碰撞数据。粒子物理学家的任务是挖掘大量且不断增长的碰撞数据,以寻找尚未发现的粒子的证据。特别是,他们正在寻找未包含在粒子物理标准模型中的粒子,科学家怀疑我们目前对宇宙构成的理解是不完整的。

机器学习可以帮助揭示大型强子对撞机数据中未被发现的粒子

作为ATLAS合作的一部分,美国能源部(DOE)阿贡国家实验室的科学家及其同事最近使用一种称为异常检测的机器学习方法来分析大量ATLAS数据。该方法以前从未应用于对撞机实验的数据。它有可能提高协作寻找新事物的效率。此次合作涉及来自172个研究组织的科学家。

该团队利用一种名为神经网络的受大脑启发的机器学习算法来搜索数据中的异常特征或异常现象。该技术打破了寻找新物理学的传统方法。它独立于科学家的先入之见,因此不受其限制。

传统上,ATLAS科学家依靠理论模型来帮助指导他们的实验和分析朝着最有希望发现的方向发展。这通常涉及执行复杂的计算机模拟,以确定碰撞数据的某些方面根据标准模型的外观。

科学家将这些标准模型预测与ATLAS的真实数据进行比较。他们还将它们与新物理模型做出的预测进行比较,例如那些试图解释暗物质和标准模型未解释的其他现象的预测。

但到目前为止,在ATLAS记录的数十亿次碰撞中尚未观察到与标准模型的偏差。自2012年发现希格斯玻色子以来,ATLAS实验尚未发现任何新粒子。

“异常检测是进行这种搜索的一种非常不同的方式,”阿贡高能物理部门的物理学家、该研究的主要作者谢尔盖·切卡诺夫(SergeiChekanov)说。“我们的目标不是寻找非常具体的偏差,而是在完全未经探索的数据中找到不寻常的特征,这些特征可能与我们的理论预测不同。”

为了执行此类分析,科学家将数据中的每个粒子相互作用表示为类似于二维码的图像。然后,该团队通过将神经网络暴露于1%的图像来训练其神经网络。

该网络由大约200万个互连节点组成,类似于大脑中的神经元。在没有人类指导或干预的情况下,它可以识别并记住图像中表征标准模型交互的像素之间的相关性。换句话说,它学会了识别符合标准模型预测的典型事件。

训练结束后,科学家们将其余99%的图像输入神经网络以检测任何异常情况。当给定图像作为输入时,神经网络的任务是利用其对整个数据的理解来重新创建图像。

切卡诺夫说:“如果神经网络遇到新的或不寻常的东西,它就会感到困惑,并且很难重建图像。”“如果输入图像与其产生的输出之间存在很大差异,它会让我们知道在这个方向上可能有一些有趣的东西值得探索。”

利用阿贡实验室计算资源中心的计算资源,神经网络分析了2015年至2018年收集的LHCRun-2数据中的约1.6亿个事件。

尽管神经网络在该数据集中没有发现任何新物理学的明显迹象,但它确实发现了一个科学家认为值得进一步研究的异常现象。能量约为4.8太电子伏的奇异粒子衰变会产生μ子(一种基本粒子)和其他粒子射流,其方式不符合神经网络对标准模型相互作用的理解。

“我们必须进行更多调查,”切卡诺夫说。“这可能是一种统计波动,但这种衰变有可能表明存在未被发现的粒子。”

该团队计划将该技术应用于2022年开始的LHCRun-3期间收集的数据。ATLAS科学家将继续探索机器学习和异常检测作为绘制粒子物理学未知领域工具的潜力。

推荐阅读

阅读排行