Группа учёных, возглавляемая Лейбниц-Институтом астрофизики Потсдама (AIP) и Институтом космических наук Университета Барселоны (ICCUB), разработала новую модель машинного обучения, которая эффективно обрабатывает данные о 217 миллионах звёзд, наблюдаемых в рамках миссии Gaia.
Полученные результаты сопоставимы с традиционными методами оценки звёздных параметров, открывая новые возможности для картирования таких характеристик, как межзвёздная экстинкция и металлическость в Млечном Пути, что способствует лучшему пониманию звёздных популяций и структуры нашей галактики.
С выходом третьего выпуска данных миссии Gaia Европейского космического агентства астрономы получили доступ к улучшенным измерениям для 1,8 миллиарда звёзд, что создаёт значительные сложности в анализе данных. В исследовании учёные использовали машинное обучение для оценки ключевых звёздных свойств на основе спектрофотометрических данных Gaia. Модель была обучена на высококачественных данных о 8 миллионах звёзд и достигла надежных предсказаний с минимальными неопределённостями.
Арман Халатян из AIP и первый автор исследования объясняет: 'Основная техника, называемая экстремальными градиентными деревьями, позволяет точно оценивать звёздные свойства, такие как температура, химический состав и затенение межзвёздной пылью, с беспрецедентной эффективностью. Разработанная модель машинного обучения SHBoost выполняет свои задачи, включая обучение модели и предсказание, за четыре часа на одном GPU — процесс, который ранее занимал две недели и требовал 3000 высокопроизводительных процессоров.'
Этот инновационный подход значительно сокращает время вычислений, потребление энергии и выбросы CO. Это первый случай успешного применения такой техники к звёздам всех типов одновременно.
Модель обучается на высококачественных спектроскопических данных из меньших звёздных опросов и затем применяет эти знания к обширному третьему выпуску данных Gaia, извлекая ключевые звёздные параметры, используя только фотометрические и астрометрические данные, а также низкоразрешённые спектры XP Gaia.
По словам Кристины Чиаппини из AIP, 'Высокое качество результатов снижает необходимость в дополнительных ресурсоёмких спектроскопических наблюдениях при поиске хороших кандидатов для дальнейших исследований, таких как редкие звёзды с низким содержанием металлов или суперметаллические звёзды, которые имеют решающее значение для понимания ранних этапов формирования Млечного Пути.'
Эта техника оказывается ключевой для подготовки будущих наблюдений с многообъектной спектроскопией, такой как 4MIDABLE-LR, крупное исследование галактического диска и барра, которое станет частью проекта 4MOST в Европейской южной обсерватории (ESO) в Чили.
Фридрих Андерс из ICCUB добавляет: 'Новый подход модели предоставляет обширные карты химического состава Млечного Пути, подтверждая распределение молодых и старых звёзд. Данные показывают концентрацию звёзд, богатых металлами, в внутренних регионах галактики, включая бар и выпуклость, с огромной статистической мощью.'
Команда также использовала модель для картирования молодых, массивных горячих звёзд по всей галактике, подчеркивая удалённые, слабо изученные регионы, в которых происходит звездообразование. Данные также показывают, что в нашей Млечной Пути существуют 'звёздные пустоты' — области, где очень мало молодых звёзд. Более того, данные демонстрируют, где трёхмерное распределение межзвёздной пыли всё ещё плохо разрешено.
Поскольку Gaia продолжает собирать данные, способность моделей машинного обучения быстро и устойчиво обрабатывать огромные наборы данных делает их незаменимыми инструментами для будущих астрономических исследований. Успех данного подхода демонстрирует потенциал машинного обучения в революции анализа больших данных в астрономии и других научных областях, одновременно способствуя более устойчивым практикам исследований.