Neue Studie enthüllt versteckte Gene im menschlichen Genom, möglicherweise transformative Behandlungen

Bearbeitet von: TashaS Samsonova

In unserem Genom sind Tausende neuer Gene verborgen, die in der "dunklen Materie" verborgen sind. Eine aktuelle Studie zeigt, dass einige dieser kleinen DNA-Schnipsel Miniproteine produzieren können, was zu neuen Behandlungen führen könnte, einschließlich Impfstoffen und Immuntherapien gegen schwere Hirntumoren.

Der Preprint, der noch nicht begutachtet wurde, stammt von einem globalen Konsortium, das sich der Entdeckung potenzieller neuer Gene widmet. Seit der Vollendung des ersten Entwurfs des Humangenomprojekts zu Beginn des Jahrhunderts haben Wissenschaftler versucht, das genetische Buch des Lebens zu entschlüsseln. In den vier genetischen Buchstaben — A, T, C und G — steckt entscheidende Information, die helfen könnte, bedeutende medizinische Herausforderungen wie Krebs zu bekämpfen.

Ursprünglich zeigte das Humangenomprojekt, dass weniger als 30.000 Gene für den Aufbau und die Erhaltung des menschlichen Körpers verantwortlich sind, was etwa einem Drittel der vorhergesagten Zahl entspricht. Nun, fast zwei Jahrzehnte später, führen Fortschritte in der DNA-Sequenzierungstechnologie dazu, dass Wissenschaftler fragen: "Was haben wir übersehen?"

Die neue Studie schließt diese Lücke, indem sie relativ unerforschte Bereiche des Genoms untersucht, die als "nicht codierend" bekannt sind. Diese Segmente wurden bisher noch nicht mit Proteinen in Verbindung gebracht. Durch die Kombination mehrerer bestehender Datensätze identifizierte das Team Tausende potenzieller neuer Gene, die für die Produktion von etwa 3.000 Miniproteinen verantwortlich sind.

Die Funktionalität dieser Proteine muss noch getestet werden, aber erste Studien deuten darauf hin, dass einige an einem tödlichen Hirntumor bei Kindern beteiligt sind. Das Forschungsteam stellt seine Werkzeuge und Ergebnisse der breiteren wissenschaftlichen Gemeinschaft zur weiteren Untersuchung zur Verfügung. Ihre Plattform erstreckt sich über die menschliche Genetik hinaus und ermöglicht die Erkundung der genetischen Blaupausen anderer Organismen.

Trotz anhaltender Rätsel helfen die Ergebnisse "ein vollständigeres Bild des kodierenden Teils des Genoms zu liefern", sagte Ami Bhatt von der Stanford-Universität.

Das Sequenzieren eines Genoms ähnelt dem Lesen eines Buches ohne Interpunktion. Während das Sequenzieren heutzutage dank sinkender Kosten und höherer Effizienz relativ einfach ist, ist die Interpretation der Daten komplex. Seit dem Humangenomprojekt haben Forscher versucht, die "Wörter" oder Gene zu identifizieren, die Proteine produzieren. Diese DNA-Sequenzen werden weiter in dreibuchstabige Codons unterteilt, von denen jedes eine spezifische Aminosäure kodiert, das grundlegende Bauelement eines Proteins.

Wenn ein Gen aktiviert wird, wird es in Messenger-RNA transkribiert, die genetische Informationen von DNA zur Ribosomen, der Proteinfabrik der Zelle, transportiert. Man kann sich den Prozess wie ein Brötchen vorstellen, durch das ein RNA-Molekül verläuft.

Bei der ersten Definition eines Gens konzentrieren sich Wissenschaftler auf offene Leserahmen, die aus spezifischen DNA-Sequenzen bestehen, die angeben, wo ein Gen beginnt und endet. Dieser Rahmen scannt das Genom nach potenziellen Genen, die dann durch Laborexperimente anhand verschiedener Kriterien validiert werden, darunter die Fähigkeit, Proteine von mehr als 100 Aminosäuren zu produzieren. Die Sequenzen, die diese Kriterien erfüllen, werden in GENCODE, einer internationalen Datenbank offiziell anerkannter Gene, zusammengefasst.

Gene, die Proteine kodieren, haben aufgrund ihrer Relevanz für das Verständnis von Krankheiten und der Inspiration von Behandlungsmethoden große Aufmerksamkeit auf sich gezogen. Ein erheblicher Teil unseres Genoms ist jedoch "nicht codierend", was bedeutet, dass große Abschnitte davon keine bekannten Proteine produzieren.

Jahrelang wurden diese DNA-Stücke als Müll betrachtet — die defekten Überreste unserer evolutionären Vergangenheit. Neuere Studien haben jedoch begonnen, verborgenen Wert zu offenbaren. Einige Abschnitte regulieren, wann Gene ein- oder ausgeschaltet werden. Andere, wie Telomere, schützen vor der Zersetzung von DNA während der Replikation und mildern die Auswirkungen des Alterns.

Trotz der dogmatischen Überzeugung, dass diese Sequenzen keine Proteine produzieren, häuft sich die neueste Evidenz, dass nicht-codierende Bereiche tatsächlich Protein produzierende Segmente enthalten, die die Gesundheit beeinflussen.

Eine Studie fand heraus, dass ein kleiner fehlender Abschnitt in angeblich nicht codierenden Bereichen bei Säuglingen zu erblichen Darmerkrankungen führte. Bei genetisch modifizierten Mäusen, die dasselbe Problem nachahmten, verringerte die Wiederherstellung des DNA-Schnipsels — der noch nicht als Gen definiert ist — die Symptome. Die Ergebnisse unterstreichen die Notwendigkeit, über bekannte protein-kodierende Gene hinauszugehen, um klinische Befunde zu erklären, schrieben die Autoren.

Diese als nicht-kanonische offene Leserahmen (ncORFs) oder "vielleicht-Gene" bezeichneten Schnipsel sind in verschiedenen menschlichen Zelltypen und Krankheiten aufgetaucht, was darauf hindeutet, dass sie physiologische Rollen haben.

Im Jahr 2022 begann das Konsortium hinter der neuen Studie, mögliche Funktionen zu erkunden, in der Hoffnung, unser genetisches Vokabular zu erweitern. Anstatt das Genom zu sequenzieren, untersuchten sie Datensätze, die RNA verfolgten, während sie in Proteine im Ribosom umgewandelt wurde.

Die Methode erfasst die tatsächliche Ausgabe des Genoms — selbst extrem kurze Aminosäureketten, die normalerweise als zu klein angesehen werden, um Proteine zu bilden. Ihre Suche ergab einen Katalog von über 7.000 menschlichen "vielleicht-Genen", von denen einige Mikropotekte produzierten, die schließlich in Krebs- und Herz-Zellen nachgewiesen wurden.

Aber insgesamt, zu diesem Zeitpunkt, "konzentrierten wir uns nicht auf die Fragen der Proteinexpression oder Funktionalität", schrieb das Team. Daher erweiterten sie ihre Zusammenarbeit in der neuen Studie und begrüßten Spezialisten für Proteinwissenschaften von über 20 Institutionen weltweit, um die "vielleicht-Gene" zu entschlüsseln.

Sie schlossen auch mehrere Ressourcen ein, die Protein-Datenbanken aus verschiedenen Experimenten bereitstellen — wie die Human Proteome Organization und PeptideAtlas — und fügten Daten aus veröffentlichten Experimenten hinzu, die das menschliche Immunsystem zur Erkennung von Proteinfragmenten verwendeten.

Insgesamt analysierte das Team über 7.000 "vielleicht-Gene" aus einer Vielzahl von Zellen: gesunde, krebsartige und auch unsterbliche Zelllinien, die im Labor gezüchtet wurden. Mindestens ein Viertel dieser "vielleicht-Gene" wurde in über 3.000 Miniproteine übersetzt. Diese sind viel kleiner als normale Proteine und haben eine einzigartige Aminosäurezusammensetzung. Sie scheinen auch stärker auf Teile des Immunsystems abgestimmt zu sein — was bedeutet, dass sie Wissenschaftlern potenziell helfen könnten, Impfstoffe, Autoimmunbehandlungen oder Immuntherapien zu entwickeln.

Einige dieser neu gefundenen Miniproteine könnten überhaupt keine biologische Rolle haben. Aber die Studie bietet Wissenschaftlern eine neue Möglichkeit, potenzielle Funktionen zu interpretieren. Zur Qualitätssicherung organisierte das Team jedes Miniprotein in eine andere Kategorie, basierend auf der Menge an Beweisen aus Experimenten, und integrierte sie in eine bestehende Datenbank für andere zur Erkundung.

Wir beginnen gerade erst, die dunkle Materie unseres Genoms zu erforschen. Viele Fragen bleiben.

„Eine einzigartige Fähigkeit unserer Multi-Consortium-Kooperation ist die Fähigkeit, einen Konsens über die wichtigsten Herausforderungen zu entwickeln“, schrieb das Team.

Einige Experimente verwendeten Krebszellen, was bedeutet, dass bestimmte "vielleicht-Gene" möglicherweise nur in diesen Zellen aktiv sind — aber nicht in normalen. Sollten sie als Gene bezeichnet werden?

Von hier aus könnten Deep Learning und andere KI-Methoden helfen, die Analyse zu beschleunigen. Obwohl die Annotation von Genen "historisch auf manueller Inspektion" der Daten beruht, schrieben die Autoren, kann KI durch mehrere Datensätze viel schneller arbeiten, wenn auch nur als erster Durchgang, um neue Gene zu finden.

Wie viele könnten Wissenschaftler entdecken? "50.000 ist im Bereich des Möglichen", sagte Studienautor Thomas Martinez.

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?

Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.