KI erkennt kranke Zellen
Kartierung von Einzelzelldaten auf Referenzatlanten

Kartierung neuer Zellkohorten von gesunden Personen und COVID-19-Erkrankten auf einem Referenzatlas für gesunde Zellen (Hellblau: Gesunde Referenzzellen. Blau: Neue Zellen von gesunden Personen. Schwarz: Neue Zellen von COVID-19-Erkrankten mit moderatem Verlauf. Rot: Neue Zellen von schwer an COVID-19 Erkrankten.)
Kranke Zellen genau identifizieren: Dafür haben Forschende der Technischen Universität München (TUM) und des Helmholtz Zentrums München einen Algorithmus entwickelt. Er basiert auf künstlicher Intelligenz (KI) und vergleicht die Zellen kranker Personen mit einem Referenzatlas gesunder Zellen.
Der Human Cell Atlas
Der Human Cell Atlas ist der weltweit größte, kontinuierlich wachsende Einzelzell-Referenzatlas. Er enthält Referenzen von Millionen von Zellen aus verschiedenen Geweben, Organen und Entwicklungsstadien. Diese Referenzen helfen, die Einflüsse von Alterung, Umwelt und Krankheit auf eine Zelle zu verstehen – und letztlich Patient*innen besser zu behandeln.
Einzelzellatlanten werden heute routinemäßig erstellt und dienen als Referenz für die Analyse kleinerer Studien. Sie in der personalisierten Medizin zu nutzen, ist jedoch mit Herausforderungen verbunden: Einzelzell-Datensätze können Messfehler enthalten (Batch-Effekt), die Rechenressourcen sind begrenzt und die Weitergabe von Rohdaten ist oft rechtlich eingeschränkt.
scArches: Deep-Learning-Strategie zur Datenabfrage
Mohammad Lotfollahi, Teamleiter am Helmholtz Zentrum und TUM Doktorand, und Fabian Theis, Professor für Mathematische Modellierung biologischer Systeme an der TUM und Direktor des Institute of Computational Biology am Helmholtz Zentrum München, entwickelten einen Algorithmus namens 'scArches', kurz für 'Single-Cell Architecture Surgery'. Dieser bildet Abfragedatensätze auf eine Referenz ab.
"Statt Rohdaten zwischen Kliniken oder Forschungseinrichtungen zu teilen, vergleicht der Algorithmus mittels Transfer-Learning neue Datensätze aus der Einzelzellgenomik mit bestehenden Referenzen. Wir nennen diesen Prozess Kartierung. So wahrt der Algorithmus die Privatsphäre und Anonymität der Patient*innen. Dies macht auch das Kommentieren und Interpretieren neuer Datensätze sehr einfach und demokratisiert die Nutzung von Referenzatlanten enorm", beschreibt Mohammad Lotfollahi die Vorteile des Algorithmus.
Ihre Ergebnisse stellen die Forschenden in der Fachzeitschrift Nature Biotechnology vor: Mapping single-cell data to reference atlases by transfer learning
Mapping single-cell data to reference atlases by transfer learning https://t.co/PaRp1n6yATpic.twitter.com/a4vVgfOdBf
— Nature Biotechnology (@NatureBiotech) August 30, 2021
Forschung an COVID-19
Mithilfe von scArches forschte die Gruppe bereits an COVID-19. Sie verglich die Zellen aus Lungenproben von COVID-19-Erkrankten mit gesunden Referenzzellen. Der Algorithmus war in der Lage, kranke Zellen von gesunden zu unterscheiden und ermöglichte es den Forschenden, sowohl bei leichten als auch schweren COVID-19-Fällen die betroffenen Zellen genau zu identifizieren. Biologische Variationen zwischen den Patient*innen hatten keinen Einfluss auf die Qualität der Kartierung.
"In Zukunft wollen wir Zellreferenzen genauso einfach nutzen, wie wir es heute mit Genomreferenzen tun", sagt Fabian Theis und erklärt: "Mit anderen Worten: Wenn man einen Kuchen backt, möchte man nicht erst ein Rezept erfinden, stattdessen schlägt man einfach in einem Kochbuch nach. Mit scArches formalisieren und vereinfachen wir diesen Nachschlageprozess."