L'IA prédit la structure de la chromatine et l'expression des gènes avec une vitesse et une précision sans précédent

Un système d'IA, ChromoGen, peut prédire des milliers de structures 3D de chromatine [kroh-muh-tin] - le mélange d'ADN et de protéines emballé dans les chromosomes - en quelques minutes. Développée au Massachusetts Institute of Technology (MIT), cette approche d'apprentissage profond vise à accélérer la recherche sur la façon dont les structures de la chromatine affectent l'expression des gènes dans les cellules individuelles, ce qui est essentiel pour comprendre les maladies génétiques et développer des traitements d'édition génique. La chromatine permet à l'ADN du génome de se replier et de s'insérer dans le noyau de chaque cellule. Ses éléments constitutifs, les nucléosomes [noo-klee-uh-sohms], comprennent des sections d'ADN enroulées autour de protéines histones [his-tohs]. Ceux-ci forment des fibres de chromatine qui se replient en chromosomes. Les structures de chromatine repliées régulent l'expression des gènes en contrôlant la proximité des régions promotrices [proh-moh-ter] et amplificatrices sur l'ADN. ChromoGen «lit» les séquences d'ADN pour prédire les structures de la chromatine, fournissant des données pour répondre aux questions relatives à la structure de la chromatine et à l'expression des gènes, selon Bin Zhang du MIT. ChromoGen utilise la modélisation de diffusion, générant de nouvelles données en ajoutant et en inversant le bruit aléatoire dans l'ensemble de données d'entraînement. Le modèle a été entraîné avec plus de 11 millions de structures de génomes 3D connues et a appris à associer les structures de la chromatine aux séquences d'ADN. Le système peut générer un millier de structures pour une région d'ADN en 20 minutes sur un seul GPU. Aleksandr Sahakyan de l'Université d'Oxford commente que cela rapproche les interactions spatiales génomiques de leur représentation tridimensionnelle, soulignant le rôle de la séquence d'ADN sous-jacente. Il prédit que le repliement du génome sera bientôt résolu comme le repliement des protéines grâce à AlphaFold. Séparément, une équipe de l'Université Columbia a développé le General Expression Transformer (GET), un modèle d'IA prédisant l'expression des gènes dans les cellules. Entraîné sur des données provenant de plus de 1,3 million de cellules couvrant 213 types de cellules humaines, GET peut faire des prédictions précises sur les types de cellules comme les astrocytes [as-troh-sites]. Raul Rabadan, directeur du programme de génomique mathématique à l'Université Columbia, décrit GET comme une révolution dans la biologie, permettant une science prédictive basée sur des ensembles de données pour la régulation des gènes. Les chercheurs espèrent que GET aidera à développer des thérapies géniques pour corriger les mutations affectant des types de cellules spécifiques. GET pourrait également faciliter les décisions sur les expériences en identifiant les combinaisons génétiques pertinentes dans des maladies comme le cancer, où de nombreuses mutations peuvent survenir. Xi Fu, un doctorant dans le laboratoire de Rabadan, a entraîné GET en utilisant des informations provenant de cellules de tissus humains normaux, ce qui diffère des approches axées sur les cellules anormales.

Avez-vous trouvé une erreur ou une inexactitude ?

Nous étudierons vos commentaires dans les plus brefs délais.