近日,中国科学院新疆天文台硕士研究生黄震洋在王娜研究员和刘志勇高级工程师的指导下,面向星系团尺度暗物质性质研究,构建了一种名为卷积柯尔莫哥洛夫–阿诺德网络(Convolutional Kolmogorov–Arnold Networks, CKAN)的可解释人工智能框架。该研究旨在提升AI在天体物理应用中的透明度,推动 AI for Astronomy & Astrophysics 交叉领域发展,相关成果已发表于国际天文学核心期刊《天文学杂志》(The Astronomical Journal, 170, 263, 2025)。
暗物质的本质是当代天体物理学中最前沿的科学问题之一。冷暗物质(CDM)模型在大尺度宇宙结构上取得了显著成功,但在星系团核心等小尺度上却面临一系列张力;自相互作用暗物质(SIDM)模型则为这些现象提供了另一种可能的解释。随着机器学习技术的快速发展,AI 正逐渐成为探索宇宙的重要工具。在星系团暗物质性质研究方面,洛桑联邦理工学院(EPFL)的研究人员曾在《自然·天文学》(Nature Astronomy)上发表重要成果,证明卷积神经网络(CNN)能够从包含复杂重子物理过程的星系团模拟中“读出”极其细微的结构特征,从而高效地区分不同暗物质模型,为利用 AI 攻克这一物理难题奠定了基础。然而,研究团队也意识到:尽管传统 CNN 表现亮眼,但其庞大的参数规模和“黑盒”式决策机制在一定程度上限制相关领域的发展。
为突破这一瓶颈,科研人员引入了基于柯尔莫哥洛夫–阿诺德表示定理(Kolmogorov–Arnold representation theorem)的 CKAN 架构。该网络通过可学习的激活函数替代传统固定激活形式,在保持高分类精度的同时,其内部结构可以进一步进行符号化,从而显著提升模型的可解释性。对符号化后的网络进行分析表明,AI 模型会自发“关注”星系团中暗物质晕中心与星系团中心的偏移(miscentering)、核心区域的热传导特征等关键物理量,这些由模型自动提取的特征与现有理论预期在趋势上一致,有助于研究者初步理解神经网络的内部决策机制。在此基础上,他们进一步结合网络测试结果与可解释性分析,给出了一个定量推断:在星系团尺度,要想从观测中可靠识别暗物质的自相互作用特征,其自相互作用截面至少需要达到约 0.1-0.3cm2g-1。这一阈值区间与近期基于星系团模拟的独立分析是一致的。
科研人员还进一步引入了基于望远镜参数(如 JWST、Euclid)的模拟观测噪声,对 CKAN 的鲁棒性进行了测试。结果表明,即便在加入了相应的噪声后,CKAN 仍能保持良好的模型判别与特征识别能力。 这项工作不仅为利用下一代巡天数据研究暗物质性质提供了一种高效且可解释的新工具,也展示了将 AI 方法从数值模拟推向实际观测应用的有益探索,为未来在天体物理数据中利用 AI 开展特征提取和潜在物理规律挖掘提供了一种新思路。

CKAN网络在模拟的JWST(绿色曲线)和Euclid(蓝色曲线)观测噪声环境下的测试结果,其中n为样本数。图中展示了训练完成的模型对未参与训练的CDM-hi AGN样本(截面真实值为0)的评估,结果显示即便存在模拟观测噪声,网络对暗物质截面的预测偏差仍较小。这表明该框架具有良好的抗噪性能和鲁棒性,有望应用于未来的实际观测数据分析。



