Revolutionäres Machine-Learning-Modell verbessert die Analyse von Stellar-Daten der Gaia-Mission

Eine Gruppe von Wissenschaftlern, angeführt vom Leibniz-Institut für Astrophysik Potsdam (AIP) und dem Institut für Kosmowissenschaften der Universität Barcelona (ICCUB), hat ein neuartiges Machine-Learning-Modell entwickelt, das die Daten von 217 Millionen Sternen, die von der Gaia-Mission beobachtet wurden, effizient verarbeitet.

Die Ergebnisse stehen in Konkurrenz zu traditionellen Methoden zur Schätzung von stellarischen Parametern und eröffnen neue Möglichkeiten zur Kartierung von Eigenschaften wie interstellarer Extinktion und Metallizität in der Milchstraße, was unser Verständnis von stellaren Populationen und der Struktur unserer Galaxie verbessert.

Mit der dritten Datenveröffentlichung der Gaia-Mission der Europäischen Weltraumorganisation haben Astronomen nun Zugang zu verbesserten Messungen von 1,8 Milliarden Sternen, was eine erhebliche Herausforderung bei der Datenanalyse darstellt. Die Forscher haben Machine Learning eingesetzt, um wichtige stellare Eigenschaften anhand der spektrophotometrischen Daten von Gaia zu schätzen. Ihr Modell, das auf hochwertigen Daten von 8 Millionen Sternen trainiert wurde, erzielte zuverlässige Vorhersagen mit minimalen Unsicherheiten.

Arman Khalatyan vom AIP und erster Autor der Studie erklärt: 'Die zugrunde liegende Technik, die als extreme Gradient-Boosted Trees bekannt ist, ermöglicht die präzise Schätzung von stellarischen Eigenschaften wie Temperatur und chemischer Zusammensetzung mit beispielloser Effizienz. Das entwickelte Machine-Learning-Modell SHBoost erledigt seine Aufgaben, einschließlich Modelltraining und Vorhersage, innerhalb von vier Stunden auf einer einzigen GPU – ein Prozess, der zuvor zwei Wochen und 3.000 Hochleistungsprozessoren erforderte.'

Diese innovative Methode reduziert signifikant die Rechenzeit, den Energieverbrauch und die CO-Emissionen. Es ist das erste Mal, dass eine solche Technik erfolgreich auf Sterne aller Typen gleichzeitig angewendet wurde.

Das Modell trainiert mit hochwertigen spektroskopischen Daten aus kleineren stellaren Surveys und wendet dieses Wissen auf die umfangreiche dritte Datenveröffentlichung von Gaia an, um wichtige stellare Parameter nur mit photometrischen und astrometrischen Daten sowie den Gaia-Niedrigauflösungs-XP-Spektren zu extrahieren.

Cristina Chiappini vom AIP sagt: 'Die hohe Qualität der Ergebnisse verringert die Notwendigkeit zusätzlicher ressourcenintensiver spektroskopischer Beobachtungen, wenn es darum geht, gute Kandidaten für weiterführende Studien zu finden, wie etwa seltene metallarme oder supermetallreiche Sterne, die für das Verständnis der frühesten Phasen der Bildung der Milchstraße entscheidend sind.'

Diese Technik ist entscheidend für die Vorbereitung zukünftiger Beobachtungen mit Multi-Objekt-Spektroskopie, wie etwa 4MIDABLE-LR, einer großen Umfrage der galaktischen Scheibe und des Bulge, die Teil des 4MOST-Projekts am Europäischen Südsternwarte (ESO) in Chile sein wird.

Friedrich Anders vom ICCUB fügt hinzu: 'Der neue Modellansatz bietet umfassende Karten der chemischen Zusammensetzung der Milchstraße, die die Verteilung von jungen und alten Sternen bestätigen. Die Daten zeigen die Konzentration metallreicher Sterne in den inneren Regionen der Galaxie, einschließlich der Bar und des Bulge, mit enormer statistischer Power.'

Das Team nutzte das Modell auch, um junge, massive heiße Sterne in der gesamten Galaxie zu kartieren und dabei weit entfernte, wenig untersuchte Regionen hervorzuheben, in denen Sterne entstehen. Die Daten zeigen auch, dass es in unserer Milchstraße eine Reihe von 'sternlosen Räumen' gibt, d.h. Gebiete, die sehr wenige junge Sterne beherbergen. Darüber hinaus zeigen die Daten, wo die dreidimensionale Verteilung von interstellarer Staub noch schlecht aufgelöst ist.

Während Gaia weiterhin Daten sammelt, macht die Fähigkeit von Machine-Learning-Modellen, die riesigen Datensätze schnell und nachhaltig zu verarbeiten, sie zu einem unverzichtbaren Werkzeug für zukünftige astronomische Forschungen. Der Erfolg dieses Ansatzes zeigt das Potenzial von Machine Learning, die Analyse großer Datenmengen in der Astronomie und anderen wissenschaftlichen Bereichen zu revolutionieren und gleichzeitig nachhaltigere Forschungspraktiken zu fördern.

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?

Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.