KI sagt Chromatinstruktur und Genexpression mit beispielloser Geschwindigkeit und Genauigkeit voraus

Ein KI-System, ChromoGen, kann Tausende von 3D-Strukturen von Chromatin [kroh-muh-tin] - der Mischung aus DNA und Proteinen, die in Chromosomen verpackt sind - in wenigen Minuten vorhersagen. Dieser am Massachusetts Institute of Technology (MIT) entwickelte Deep-Learning-Ansatz zielt darauf ab, die Forschung darüber zu beschleunigen, wie sich Chromatin-Strukturen auf die Genexpression in einzelnen Zellen auswirken, was für das Verständnis genetischer Krankheiten und die Entwicklung von Gen-Editing-Behandlungen von entscheidender Bedeutung ist. Chromatin ermöglicht es der DNA im Genom, sich zusammenzufalten und in den Zellkern jeder Zelle zu passen. Seine Bausteine, Nukleosomen [noo-klee-uh-sohms], bestehen aus DNA-Abschnitten, die um Histon [his-tohs]-Proteine gewickelt sind. Diese bilden Chromatinfasern, die sich zu Chromosomen falten. gefaltete Chromatin-Strukturen regulieren die Genexpression, indem sie die Nähe von Promotor [proh-moh-ter]- und Enhancer-Regionen auf der DNA steuern. ChromoGen 'liest' DNA-Sequenzen, um Chromatin-Strukturen vorherzusagen, und liefert Daten, um Fragen im Zusammenhang mit Chromatin-Struktur und Genexpression zu beantworten, so Bin Zhang vom MIT. ChromoGen verwendet Diffusionsmodellierung und generiert neue Daten, indem es zufälliges Rauschen im Trainingsdatensatz hinzufügt und umkehrt. Das Modell wurde mit über 11 Millionen bekannten 3D-Genomstrukturen trainiert und lernte, Chromatin-Strukturen mit DNA-Sequenzen zu assoziieren. Das System kann tausend Strukturen für eine DNA-Region in 20 Minuten auf einer GPU generieren. Aleksandr Sahakyan an der Universität Oxford kommentiert, dass dies genomische räumliche Interaktionen näher an ihre dreidimensionale Darstellung bringt und die Rolle der zugrunde liegenden DNA-Sequenz umreißt. Er prognostiziert, dass die Genomfaltung bald wie die Proteinfaltung durch AlphaFold gelöst wird. Unabhängig davon entwickelte ein Team der Columbia University den General Expression Transformer (GET), ein KI-Modell, das die Genexpression in Zellen vorhersagt. GET wurde mit Daten von über 1,3 Millionen Zellen trainiert, die 213 menschliche Zelltypen abdecken, und kann genaue Vorhersagen über Zelltypen wie Astrozyten [as-troh-sites] treffen. Raul Rabadan, Direktor des Programms für mathematische Genomik an der Columbia University, beschreibt GET als eine Revolution in der Biologie, die eine prädiktive Wissenschaft ermöglicht, die auf Datensätzen für die Genregulation basiert. Forscher hoffen, dass GET bei der Entwicklung von Gentherapien zur Korrektur von Mutationen helfen wird, die bestimmte Zelltypen betreffen. GET könnte auch Entscheidungen über Experimente erleichtern, indem es relevante genetische Kombinationen bei Krankheiten wie Krebs identifiziert, bei denen zahlreiche Mutationen auftreten können. Xi Fu, ein Doktorand in Rabadans Labor, trainierte GET mit Informationen aus normalen menschlichen Gewebezellen, was sich von Ansätzen unterscheidet, die sich auf abnormale Zellen konzentrieren.

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?

Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.