ИИ предсказывает структуру хроматина и экспрессию генов с беспрецедентной скоростью и точностью

Система искусственного интеллекта (ИИ) ChromoGen может предсказывать тысячи трехмерных структур хроматина [kroh-muh-tin] - смеси ДНК и белков, упакованных в хромосомы, - за считанные минуты. Этот подход глубокого обучения, разработанный в Массачусетском технологическом институте (MIT), направлен на ускорение исследований того, как структуры хроматина влияют на экспрессию генов в отдельных клетках, что имеет решающее значение для понимания генетических заболеваний и разработки методов редактирования генов. Хроматин позволяет ДНК в геноме складываться и помещаться в ядро каждой клетки. Его строительные блоки, нуклеосомы [noo-klee-uh-sohms], состоят из участков ДНК, намотанных на белки гистоны [his-tohs]. Они образуют волокна хроматина, которые складываются в хромосомы. Сложенные структуры хроматина регулируют экспрессию генов, контролируя близость промоторных [proh-moh-ter] и энхансерных участков на ДНК. ChromoGen «считывает» последовательности ДНК для предсказания структур хроматина, предоставляя данные для ответа на вопросы, касающиеся структуры хроматина и экспрессии генов, по словам Бина Чжана из MIT. ChromoGen использует моделирование диффузии, генерируя новые данные путем добавления и обращения случайного шума в обучающем наборе данных. Модель была обучена на более чем 11 миллионах известных трехмерных структур генома и научена связывать структуры хроматина с последовательностями ДНК. Система может генерировать тысячу структур для участка ДНК за 20 минут на одном графическом процессоре. Александр Саакян из Оксфордского университета отмечает, что это приближает геномные пространственные взаимодействия к их трехмерному представлению, подчеркивая роль основной последовательности ДНК. Он предсказывает, что сворачивание генома скоро будет решено, как и сворачивание белка, с помощью AlphaFold. Отдельно группа из Колумбийского университета разработала General Expression Transformer (GET), модель ИИ, предсказывающую экспрессию генов в клетках. Обученная на данных более чем 1,3 миллиона клеток, охватывающих 213 типов клеток человека, GET может делать точные прогнозы о типах клеток, таких как астроциты [as-troh-sites]. Рауль Рабадан, директор Программы математической геномики в Колумбийском университете, описывает GET как революцию в биологии, позволяющую проводить прогностическую науку на основе наборов данных для регуляции генов. Исследователи надеются, что GET поможет в разработке генной терапии для коррекции мутаций, затрагивающих определенные типы клеток. GET также может облегчить принятие решений об экспериментах, выявляя соответствующие генетические комбинации при таких заболеваниях, как рак, где может произойти множество мутаций. Си Фу, докторант в лаборатории Рабадана, обучил GET, используя информацию из нормальных клеток тканей человека, что отличается от подходов, ориентированных на аномальные клетки.

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.