高能物理实验领域面临的核心挑战之一是在海量数据中迅速而准确地识别极其稀有、微弱的信号。对科研工作者而言,“大海捞针”几乎是日常工作。随着机器学习和人工智能技术的快速发展,利用智能算法重塑高能物理数据分析范式,正在成为国际前沿方向。鉴于此,BESIII实验课题组胡继峰副研究员聚焦于未来轻子对撞机上的新物理探测,借助机器学习技术探索了在轻子对撞机上寻找长寿命粒子(long-lived particles, LLPs)的潜力,相关结果发表于《Frontier of Physics》期刊[1-2]。
长寿命粒子是寻找新物理的重要探针之一。在粒子对撞实验中,LLP粒子可在探测器中留下明显的能量和空间位置信息。轻子对撞机,如环形电子对撞机(CEPC)和国际线性对撞机(ILC),因其对撞环境十分干净,为研究LLPs粒子提供了理想的平台。正负电子对撞后会产生希格斯粒子,其后希格斯粒子可衰变成两个长寿命粒子(图一)。长寿命粒子的衰变产物会在探测器上留下“位移顶点”和“延迟信号”等独特踪迹。传统分析通常依赖复杂的事件重建和多步筛选流程,既耗费大量计算资源,也难以在多维参数空间内保持最优灵敏度,限制了对撞机上对长寿命粒子的探测潜力。
图一:正负电子对撞产生一对中微子和两个长寿命粒子的高能粒子对撞事件,物理反应式为
。蓝色的直线表示正负电子对,绿色的直线代表中微子。左右两团彩色的点云(黄色、红色、蓝色等)代表长寿命粒子衰变产生的各种可见粒子在探测器中留下的信号
华南师大胡继峰团队、上海交大李亮团队和之江实验室等合作单位创造性的提出了针对长寿命粒子的“端到端”探测方法,直接从探测器底层响应出发,分别构建卷积神经网络(CNN)与图神经网络(GNN)两类深度学习模型,自动学习空间-时间能量沉积模式,实现对信号与背景的高效区分。CNN模型把探测单元的能量沉积和时间分布转化为图像数据,让神经网络自动学习不同空间位置上的能量和时间模式;GNN模型则把每个击中点看作一个“节点”,通过分析它们之间的几何关系来捕捉空间和时间上的相关性。研究表明,在典型质量与寿命参数下,两种模型都能够大幅提高长寿命粒子的探测效率,同时有效抑制标准模型背景。长寿命粒子信号探测效率可达95%,体现了深度学习方法的显著优越性。CNN模型的总体性能更好,尤其在高质量和长寿命场景下表现最佳,而GNN模型在低质量或弱能量沉积情形下更具鲁棒性,两者互为补充。
希格斯粒子衰变成长寿命粒子的比例(分支比)决定了产生的长寿命粒子数目多少,而该比例上限代表了探测方法的灵敏度,比例上限越低意味着探测方法的灵敏度越高。“端到端”的探测方法能够将该比例上限压低到百万分之一的水平(图二),比现有束流实验结果好了三到四个数量级。新的探测方法大幅提升了探测灵敏度,展现了深度学习和人工智能方法在新物理信号寻找中的巨大潜力与优势。
该研究受到了国家重点研发计划项目(2024YFA1610603、2023YFA1606003)与国家自然基金委项目(12375072等)的资助。
图二:希格斯粒子衰变到长寿命粒子的比例(分支比)预测上限示意图(95%置信度下)。横轴是长寿命粒子的寿命,纵轴为希格斯粒子衰变到长寿命粒子的比例。不同颜色的线条代表不同质量长寿命粒子的预测值上限,阴影部分代表该上限的误差。
作者:胡继峰|通讯员:史瑞佳
[1] Search for Long-lived Particles at Future Lepton Colliders Using Deep Learning Techniques
[2] https://url.scnu.edu.cn/record/view/index.html?key=995ff449775d6b136dfdeba2a74c5fed