С ростом моделей искусственного интеллекта (ИИ) эксперты отрасли предполагают, что будущее ИИ может зависеть от нового типа суперкомпьютера, который соединяет несколько дата-центров на огромных расстояниях.
С увеличением спроса на вычислительную мощность аналитики предсказывают, что традиционные дата-центры могут больше не справляться с задачами. "Распределение неизбежно", заявил Самех Бужелбене, аналитик компании Dell'Oro.
Компании, такие как Nvidia, исследуют возможности интеграции удаленных дата-центров в единый виртуальный суперкомпьютер. Этот подход может помочь справиться с ограничениями по мощности и повысить эффективность обучения ИИ.
Современные технологии, такие как InfiniBand от Nvidia и плотная волновая длина мультиплексирования, позволяют передавать данные на расстояния до 40 километров. Однако уже ведутся исследования, чтобы значительно расширить эти возможности, потенциально обеспечивая соединения на тысячи километров.
Несмотря на достижения, остаются проблемы, такие как задержка и пропускная способность. Рабочие нагрузки ИИ требуют высокой пропускной способности и низкой задержки, и до 30% времени обучения часто уходит на ожидание передачи данных. Новые технологии, включая волокно с пустым сердечником, стремятся уменьшить задержку, минимизируя необходимость в повторителях.
Эксперты подчеркивают, что оптимизация программного обеспечения может смягчить некоторые из этих проблем, позволяя более эффективное управление данными через распределенные сети. Однако достижение однородной вычислительной архитектуры между дата-центрами имеет решающее значение для избежания узких мест в производительности.
Поскольку модели ИИ становятся все более сложными, отрасли может потребоваться принять обучение в нескольких дата-центрах, чтобы не отставать. Хотя ограничения по мощности в настоящее время ограничивают количество GPU в одном дата-центре, необходимость в распределенных рабочих нагрузках может вскоре стать критически важной.