Symulacje superkomputerowe Wszechświata to przedsięwzięcie astronomicznie kosztowne. Obliczenie ewolucji miliardów galaktyk wymaga tygodni pracy najpotężniejszych klastrów obliczeniowych. Nic dziwnego, że astrofizycy powierzyli tę rutynę sztucznej inteligencji. Okazało się jednak, że medal ma drugą stronę. Optymalizacja obliczeń niemal zablokowała drogę do odkrycia nowej fizyki.
Zespół badaczy z Princeton i Instytutu Flatiron pod kierunkiem Veeny Krishnaraj i Adriana Bayera postanowił zastosować w kosmologii metodę uczenia transferowego (transfer learning). Zasada jest elegancka: zamiast przeprowadzać ciężkie symulacje od zera, sieć neuronowa jest najpierw „trenowana” na prostych i tanich modelach standardowego Wszechświata (ΛCDM). Następnie algorytm jest poddawany krótkiemu douczaniu na zaawansowanych modelach, uwzględniających prawa alternatywnej grawitacji lub masę neutrin.
Oszczędności okazały się kolosalne. Koszty eksploatacji superkomputerów spadły ponad dziesięciokrotnie. Przełom? Nie do końca.
Wykorzystując słynny zbiór wirtualnych wszechświatów Quijote, naukowcy wykryli ukryty błąd systemowy. W uczeniu maszynowym zjawisko to określa się mianem „transferu negatywnego”. Gdy sieć neuronowa napotyka przejawy fundamentalnie nowej fizyki, zaczyna uporczywie dopasowywać je do znanych jej już, starych wzorców.
Problem tkwi w tak zwanej degeneracji fizycznej. Jest to sytuacja, w której skrajnie różne procesy kosmiczne generują identyczne sygnały na obrazach z teleskopów. Przykładowo, sposób, w jaki masywne neutrina wpływają na gromady galaktyk, wizualnie jest niemal nieodróżnialny od standardowych wahań gęstości materii (parametru sigma 8). Sztuczna inteligencja przeszkolona na modelach bazowych dostrzega znajomy schemat i z pewnością raportuje: „Wszystko w porządku, to standardowy Wszechświat”. Sygnał nowej fizyki zostaje po prostu wymazany przez algorytm.
Co to dla nas oznacza? Obecnie nie można jeszcze w pełni polegać na autonomii sieci neuronowych w poszukiwaniu kosmicznych anomalii. SI to znakomite narzędzie do przyspieszania rutynowych zadań, jednak ostateczna kontrola nad wykrywaniem odchyleń wciąż należy do człowieka.
Obecnie metoda jest testowana na modelach syntetycznych, ale w przyszłości czekają ją testy na ogromnych zbiorach danych z nowych teleskopów optycznych. Zrozumienie tej wady pozwoli fizykom na skorygowanie algorytmów uczenia. W perspektywie prowadzi to do stworzenia bardziej elastycznych systemów, zdolnych nie tylko do potwierdzania wiedzy z podręczników, ale i dostrzegania anomalii, które zmienią nasze rozumienie czasu i przestrzeni.
Efekt „oślepienia” algorytmów wynika z degeneracji fizycznej – sytuacji, w której fundamentalnie różne procesy kosmiczne dają identyczne sygnały obserwacyjne.
Na razie metoda była testowana wyłącznie na danych syntetycznych. Przed nami weryfikacja za pomocą realnych przeglądów nocnego nieba. Badanie to wyraźnie wyznacza granice: SI potrafi wielokrotnie przyspieszyć rutynowe obliczenia, lecz ostateczne wykrywanie anomalii wykraczających poza Model Standardowy wciąż wymaga ścisłego nadzoru człowieka. Technologia prowadzi nas ku szybszemu testowaniu hipotez, o ile nauczymy algorytmy kwestionować ich własne bazy danych.

