宇宙的超级计算机模拟是一项极其昂贵的工程。为了计算数十亿个星系的演化过程,最强大的计算集群往往需要满负荷运行数周。理所当然地,天体物理学家将这类繁琐的常规任务交给了人工智能。然而,事情的发展却呈现出不利的一面。计算过程的优化几乎切断了通往新物理学发现的道路。
由维娜·克里希纳拉杰(Veena Krishnaraj)和艾德里安·拜尔(Adrian Bayer)领导的普林斯顿大学与弗拉提伦研究所研究团队,决定在宇宙学中应用迁移学习(transfer learning)方法。其原理非常巧妙:神经网络不再从零开始运行繁重的模拟,而是先在简单且低成本的标准宇宙(Λ CDM)模型上进行“预热”。随后,人工智能在涉及替代重力定律或考虑中微子质量的先进模型上接受进一步的微调培训。
这种做法节省了巨额成本。超级计算机的开支降低了十倍以上。这是突破吗?并非完全如此。
科学家们在使用著名的 Quijote 虚拟宇宙阵列进行研究时,发现了一个隐藏的系统性误差。在机器学习领域,这种现象被称为“负迁移”。当神经网络遇到具有基础性新物理特征的现象时,它会固执地将其套入已有的旧经验中。
问题的核心在于所谓的“物理简并”。在这种情况下,完全不同的宇宙演化过程会在望远镜图像上留下完全相同的特征。例如,大质量中微子对星系团的影响,在视觉上与标准物质密度波动(sigma Q 8 参数)几乎无法区分。在基础模型上训练的人工智能看到熟悉的模式后,会自信地报告:“一切正常,这是标准宇宙。”新物理学的信号就这样被算法抹去了。
这对我们意味着什么?目前还不能完全依赖神经网络的自主性来搜寻宇宙异常。人工智能是处理常规任务的出色加速器,但寻找异常现象的最终把关人仍需由人类担任。
虽然该方法目前正在合成模型上进行测试,但未来还将面临来自新型光学望远镜海量数据的考验。对这一缺陷的深入理解将帮助物理学家修正训练算法。从长远来看,这将促使更具灵活性系统的诞生,使其不仅能验证旧教材,还能发现足以改变我们时空认知的异常现象。
这种算法“盲区”是由物理简并引起的,即本质不同的宇宙过程产生了完全相同的观测信号。
目前,该方法仅在合成数据上进行了验证。下一步将是利用真实的夜空巡天观测进行实测。这项研究明确了人工智能的应用界限:虽然它能成倍加速常规计算,但在探索超出标准模型的异常现象时,仍需人类严密把关。只要我们能让算法学会质疑自身的数据库,技术就将引领我们走向更高效的假说验证之路。

