KI gegen Messfehler
Neue Algorithmen machen Zell-Daten vergleichbar

Der Deep Count Autoencoder bereinigt die scRNA-seq-Daten, indem er ein Auto-Encoder-Framework nutzt, um die Vielfalt der zugrundeliegenden, echten störungsfreien Daten zu lernen.
Wie verhalten sich verschiedene Zelltypen im Gewebe? Das untersuchen Forscher*innen mithilfe der Einzelzellanalyse. Dabei sequenzieren sie einzelne Zellen und finden heraus, welche Gene gerade gelesen werden. Diese Methode ist allerdings anfällig für Messfehler.
Ein Team der Technischen Universität München (TUM), des Helmholtz Zentrum München und des englischen Wellcome Sanger Institute hat jetzt Algorithmen entwickelt, die die Fehlerquellen mithilfe Künstlicher Intelligenz (KI) ausfindig machen.
Human Cell Atlas: Zell-Datenbank für Mediziner
Personalisierte Medizin ist die Vision des Human Cell Atlas. Das internationale Projekt soll eine Referenz-Datenbank schaffen, mit der Ärzte Krankheiten besser diagnostizieren und behandeln können. Dazu kartieren die Forscher*innen alle Zellen des menschlichen Körpers.
Grundlage dafür ist die Einzelzell-RNA-Sequenzierung. Mit dieser Methode lässt sich nachvollziehen, welche Gene für die Produktion einer Zelle eine Rolle spielen. Dafür sind enorm feine Messungen nötig.
Neues Maß für den Batch-Effekt
Bei den Messungen verursachen die genutzten Geräte, die Umwelt oder die Zellbiologie selbst öfter Fehler: den sogenannten Batch-Effekt. Dieser lässt sich anhand verschiedener mathematischer Modelle herausrechnen. Diese hängen jedoch davon ab, wie groß der Effekt ist.
Um die Unterschiede zwischen den Experimenten zu quantifizieren, haben Fabian Theis - Professor für Mathematische Modellierung biologischer Systeme an der TUM und Direktor des Institute of Computational Biology am Helmholtz Zentrum München - und sein Team ein neues Maß namens kBET entwickelt. Die neue Methode ist ein leistungsstarkes Werkzeug, um die Korrektur-Schemata für den Batch-Effekt zu vergleichen und enorm wichtig für die Datenintegration bei Projekten wie dem Human Cell Atlas. Die Ergebnisse sind in Nature Methods veröffentlicht.
Intelligenter Algorithmus erkennt Nullstellen-Messungen
Eine weitere Herausforderung sind Null-Messungen: "Wir sequenzieren eine Zelle und stellen fest, dass ein bestimmtes Gen in dieser Zelle überhaupt kein Signal von sich gibt. Dahinter kann sich ein biologischer oder ein technischer Grund verbergen: Entweder wird das Gen nicht abgelesen, weil es keine Rolle spielt, oder aber die Sequenz konnte aus technischen Gründen nicht erfasst werden", sagt Fabian Theis.
Um die Ursache für eine Null-Messung zu identifizieren, hat Theis‘ Forschungsgruppe einen Deep Learning Algorithmus entwickelt: Die Software beruht auf einem Wahrscheinlichkeitsmodell und vergleicht die ursprünglichen mit den rekonstruierten Daten. "Unser neuer Algorithmus basiert als einer der ersten im Bereich der Einzelzell-Genomik auf Deep Learning und ist bisher der schnellste auf diesem Gebiet", sagt Theis. Die Forschungsergebnisse sind in Nature Communications erschienen.
Theis erklärt: "Unser Ziel ist vor allem, Fehler ausfindig zu machen und zu korrigieren. Mit diesen möglichst korrekten Daten können wir dann in den Austausch mit unseren Kolleginnen und Kollegen weltweit gehen und unsere Ergebnisse mit ihren vergleichen."
Dieser Artikel basiert auf den Pressemeldungen der TUM "KI findet Fehler bei RNA-Analyse" und des Helmholtz Zentrums München "Künstliche Intelligenz gegen den Fehlerteufel".