Un modèle de machine learning révolutionnaire améliore l'analyse des données stellaires de la mission Gaia

Un groupe de scientifiques dirigé par l'Institut Leibniz d'astrophysique de Potsdam (AIP) et l'Institut des sciences cosmiques de l'Université de Barcelone (ICCUB) a développé un modèle de machine learning novateur qui traite efficacement les données de 217 millions d'étoiles observées par la mission Gaia.

Les résultats rivalisent avec les méthodes traditionnelles pour estimer les paramètres stellaires, ouvrant de nouvelles avenues pour cartographier des caractéristiques telles que l'extinction interstellaire et la métalllicité à travers la Voie lactée, ce qui améliore notre compréhension des populations stellaires et de la structure de la galaxie.

Avec la publication de la troisième base de données de la mission Gaia de l'Agence spatiale européenne, les astronomes ont désormais accès à des mesures améliorées pour 1,8 milliard d'étoiles, posant un défi significatif en matière d'analyse de données. Les chercheurs ont utilisé le machine learning pour estimer des propriétés stellaires cruciales à partir des données spectrophotométriques de Gaia. Leur modèle, formé sur des données de haute qualité provenant de 8 millions d'étoiles, a réalisé des prédictions fiables avec des incertitudes minimales.

Arman Khalatyan de l'AIP, premier auteur de l'étude, explique : 'La technique, appelée arbres de gradient extrêmes, permet une estimation précise des propriétés stellaires telles que la température et la composition chimique avec une efficacité sans précédent. Le modèle SHBoost peut accomplir ses tâches en quatre heures sur un seul GPU, un processus qui prenait auparavant deux semaines avec 3 000 processeurs haute performance.'

Cette approche innovante réduit considérablement le temps de calcul, la consommation d'énergie et les émissions de CO. C'est la première application réussie de cette technique à des étoiles de tous types simultanément.

Le modèle utilise des données spectroscopiques de haute qualité provenant de petites enquêtes et applique ces connaissances à l'énorme base de données de Gaia, extrayant des paramètres stellaires clés en utilisant uniquement des données photométriques et astrométriques, ainsi que des spectres XP de faible résolution.

Selon Cristina Chiappini de l'AIP, 'La haute qualité des résultats diminue le besoin d'observations spectroscopiques supplémentaires nécessitant beaucoup de ressources lors de l'identification de candidats pour des études ultérieures, telles que des étoiles rares pauvres en métaux ou super riches en métaux, qui sont vitales pour comprendre les premières phases de la formation de la Voie lactée.'

Cette technique est cruciale pour préparer les futures observations avec la spectroscopie multi-objets, y compris l'enquête 4MIDABLE-LR, qui fait partie du projet 4MOST à l'Observatoire européen austral (ESO) au Chili.

Friedrich Anders de l'ICCUB ajoute : 'Le nouveau modèle fournit des cartes étendues de la composition chimique de la Voie lactée, confirmant la distribution des étoiles jeunes et anciennes et révélant des concentrations d'étoiles riches en métaux dans les régions intérieures de la galaxie.'

L'équipe a également cartographié des étoiles chaudes jeunes et massives à travers la galaxie, mettant en évidence des régions peu étudiées où se produisent des formations d'étoiles. Les données indiquent la présence de 'vides stellaires' dans la Voie lactée, des zones avec très peu d'étoiles jeunes, et montrent où la distribution tridimensionnelle de la poussière interstellaire reste mal comprise.

Alors que Gaia continue sa collecte de données, la capacité des modèles de machine learning à gérer rapidement et durablement d'énormes ensembles de données les positionne comme des outils essentiels pour la recherche astronomique future, démontrant le potentiel de révolutionner l'analyse des grandes données en astronomie et de promouvoir des pratiques de recherche plus durables.

Avez-vous trouvé une erreur ou une inexactitude ?

Nous étudierons vos commentaires dans les plus brefs délais.