Une étude récente publiée dans Science met en lumière une avancée significative en biologie moléculaire, où un modèle d'IA a réussi à simuler un demi-milliard d'années d'évolution moléculaire pour créer une nouvelle protéine, nommée esmGFP.
Cette protéine fluorescente ressemble à celles que l'on trouve chez les méduses et les coraux et pourrait contribuer au développement de nouveaux médicaments. Actuellement, elle n'existe qu'en tant que code numérique, mais les scientifiques affirment qu'elle contient un plan génétique pour un nouveau type de protéine fluorescente verte.
La recherche révèle que la séquence d'acides aminés de l'esmGFP partage seulement 58 % de similarité avec la protéine connue la plus proche, une version modifiée d'une protéine trouvée chez les anémones de mer. L'étude suggère que la nature aurait nécessité 96 mutations génétiques différentes sur 500 millions d'années pour développer une telle protéine.
Le modèle d'IA, ESM3, fonctionne sans les contraintes de l'évolution naturelle, comblant les lacunes dans les séquences de protéines en se basant sur des connaissances de milliards de chemins évolutifs possibles. Formé sur des données provenant de 2,78 milliards de protéines naturelles, il génère de nouvelles séquences protéiques non trouvées auparavant dans les organismes vivants.
Cette avancée marque un bond en avant dans l'ingénierie des protéines, en particulier puisque les protéines fluorescentes sont largement utilisées dans la recherche biologique pour surveiller les processus cellulaires et les interactions moléculaires. Cependant, certains scientifiques mettent en garde que, bien que puissante, cette méthode ne peut pas remplacer les processus naturels complexes qui ont façonné la vie au cours de millions d'années.
La recherche a été développée par EvolutionaryScale, issue du travail initié par des chercheurs de Meta, la société mère de Facebook et Instagram, avant de fonder EvolutionaryScale en 2024. L'étude a été examinée par des pairs, renforçant sa crédibilité et ouvrant la voie à de nouvelles recherches sur le rôle de l'IA dans le développement des protéines et les thérapies médicales futures.