Präzisionsmedizin durch Schwarmlernen

Im vom Bundesministerium für Bildung und Forschung geförderten und vom Uniklinikum Würzburg koordinierten Projekt SWAG (SWArm learning for Generation and dissemination of high-quality data in oncology) wird das Teilen und Analysieren von Datensätzen mittels kombinierter KI-Methoden entwickelt und erprobt. Die synthetischen Datensätze und trainierten Modelle sollen öffentlich verfügbar gemacht und gemeinsam weiterentwickelt werden, um die Diagnostik und Behandlung von Krebserkrankungen zu verbessern.

Gesundheitsdaten sind überaus sensibel und unterliegen einem besonderen Schutz. Auch wenn man sie noch so sehr anonymisiert, sie dürfen aufgrund des Datenschutzes nicht herausgegeben werden und müssen dortbleiben, wo sie erhoben wurden. Das erschwert jedoch die Präzision in Diagnostik und Behandlung vieler Erkrankungen, vor allem, wenn diese selten sind. So ließe sich zum Beispiel mit einer großen Sammlung an medizinischen Bilddaten aus verschiedenen Zentren die Entwicklung von Tumoren und einer möglichen Metastasierung besser abschätzen und eine optimale Therapie wählen.

Synthetische Daten sind frei von Datenschutzbeschränkungen und Eigentumsansprüchen

Mit dem Projekt SWAG will ein interdisziplinäres Konsortium aus fünf Wissenschaftlerinnen und Wissenschaftlern die praktischen, ethischen und rechtlichen Hindernisse, die einer Sammlung großer Datensätze im Wege stehen, überwinden. Denn mit KI können klinisch relevante Parameter aus den Röntgenbildern, Computertomografie-Aufnahmen oder histologischen Befunden ausgelesen werden und zu einem KI-Modell zusammengefasst werden. Je mehr Patientendaten das KI-Modell umfasst, umso effizienter lassen sich krankhafte Veränderungen in Zellen und Gewebe vorhersagen. SWAG steht für SWArm learning for Generation and dissemination of high-quality data in oncology. Mit der noch sehr neuen Technologie Schwarmlernen sollen generative Modelle zur Synthese und Nutzbarmachung hochqualitativer Daten in der Krebsmedizin erzeugt werden.

Algorithmen bewegen sich durch Datensätze an verschiedenen Standorten

Der Schwarm besteht in diesem Fall aus Servern an fünf Standorten: der Universitätsmedizin in Aachen, Dresden, Heidelberg, Mainz und Würzburg. Über diese Server werden die gelernten, also künstlich erzeugten Modelle mittels Blockchain-Technologie untereinander ausgetauscht. Das heißt, die Daten bleiben am Standort, man teilt nur die Algorithmen und das, was sie am jeweiligen Standort dazulernen. Einen zentralen Koordinator wie es beim föderierten Lernen der Fall ist, gibt es beim Schwarmlernen nicht, wodurch die Daten zusätzlich gesichert sind. Jeder lokale Server wirkt als zentraler Server, sobald er seinen neuesten Block mit künstlichen Datensätzen mit dem vorhergehenden Block verbindet und somit das KI-Modell mit einer stetig wachsenden Datenmenge trainiert.

„Wir erzeugen synthetische Bilder, die auf ganz vielen Bildern von verschiedenen Patienten basieren, jedoch keinen Patientenbezug mehr haben und daher niemandem gehören“, bringt es Prof. Dr. Bettina Baeßler auf den Punkt. Die Leiterin der Kardiovaskulären Bildgebung und Künstlichen Intelligenz am Uniklinikum Würzburg koordiniert das SWAG-Projekt. Die Radiologin vergleicht es gern mit KI-generierten Kunstwerken: „Die KI lernt wie typische Bilder von van Gogh oder Monet aussehen. Dann sage ich: Generiere mir ein Bild, dass so aussieht, als hätte es van Gogh gemalt. Das Bild sieht dann aus wie ein van Gogh, ist aber keiner.“

Mit Swarm Learning trainierte KI-Modelle können genetische Veränderungen vorhersage

Wie vielversprechend der Einsatz von Schwarmlernen für dezentrale Künstliche Intelligenz in der Onkologie ist, haben die SWAG-Projektpartner, der Dresdner Internist Prof. Dr. Jakob Nikolas Kather, der Physiker und Mediziner Dr. Daniel Truhn aus Aachen und der Mainzer Pathologe Dr. Sebastian Försch bereits im renommierten Journal Nature Medicine publiziert. „Anhand von Daten von mehr als 5.000 Patientinnen und Patienten konnten wir zeigen, dass KI-Modelle, die mit Swarm Learning trainiert wurden, klinisch relevante genetische Veränderungen direkt aus Standardpräparaten von Gewebe aus Tumoren des Dickdarms vorhersagen können“, erläutert Jakob Kather. Weibliche Unterstützung im SWAG-Team bekommt Bettina Baeßler übrigens von der Informatikerin Prof. Dr. Sandy Engelhardt, die am Universitätsklinikum Heidelberg die AG Artificial Intelligence in Cardiovascular Medicine leitet.

Nierenzellkarzinom als Prototyp für viele andere seltene Krebserkrankungen

Mit Schwarmlernen können KI-Modelle für beliebige Bildanalyseaufgaben trainiert werden. Im SWAG-Projekt geht es zunächst um vier Modalitäten. Das heißt, die Modelle lernen mit echten, retrospektiven Patientendaten, wie Röntgen-Thorax-Bilder, CT-Aufnahmen vom Bauch (Abdomen), vom Brustkorb (Thorax) und histologische Aufnahmen, also Gewebeproben aussehen. „Der Computer spuckt dann im Grunde synthetische Bilder aus, die reine Mathematik sind, also eine Riesenformel“, beschreibt Bettina Baeßler. „Und diese vortrainierten Modelle können wir wiederum auf bestimmte Pathologien trainieren. Im SWAG-Projekt konzentrieren wir uns zunächst auf das Nierenzellkarzinom.“ Tumore in Nierenzellen sind sehr selten, sehr unterschiedlich und in vielen Fällen tödlich. Dank moderner Bildgebungsverfahren können sie zwar früh erkannt werden, doch es ist oft schwierig, eine Prognose zur Entwicklung des Tumors zu treffen und eine passende Behandlung zu wählen.

Damit die KI-Modelle auch an anderen Standorten als in Aachen, Dresden, Heidelberg, Mainz und Würzburg funktionieren, wird das Schwarmlernen mit generativem Lernen kombiniert. Ziel ist es, die synthetischen Datensätze und trainierten Modelle mit der Wissensgemeinschaft zu teilen, sie gemeinsam weiterzuentwickeln und somit seltene Tumore besser bewerten und behandeln zu können.

BMBF-Förderung im Rahmen der Nationalen Dekade gegen Krebs

SWAG wird vom Bundesministerium für Bildung und Forschung (BMBF) im Rahmen der Richtlinie zur Förderung von interdisziplinären Projekten zur Entwicklung und Erprobung von neuen Ansätzen der Datenanalyse und des Datenteilens in der Krebsforschung in der Nationalen Dekade gegen Krebs mit 1 Millionen Euro über einen Zeitraum von zwei Jahren gefördert. 

Das Logo zeigt den Schwarm, der in diesem Fall aus Servern an verschiedenen Standorten besteht, welche die Algorithmen teilen; einen zentralen Server gibt es nicht.
Im Projekt SWAG wird das Teilen und Analysieren von Datensätzen mittels kombinierter KI-Methoden entwickelt und erprobt. Der Schwarm besteht hier aus Servern an den fünf Standorten Aachen, Dresden, Heidelberg, Mainz und Würzburg, über die die künstlich erzeugten Modelle ausgetauscht werden. Man teilt nur die Algorithmen und das, was sie am jeweiligen Standort dazulernen. © Bettina Baeßler / UKW
Hier sind erste künstlich erzeugte CT-Bilder vom Bauch zu sehen.
Erste Trainingsergebnisse: Aus zahlreichen echten Patientendaten wurden erste synthetische CT-Aufnahmen vom Abdomen erstellt. © Daniel Truhn / Universitätsklinikum Aachen.
Das Logo zeigt den Schwarm, der in diesem Fall aus Servern an verschiedenen Standorten besteht, welche die Algorithmen teilen; einen zentralen Server gibt es nicht.

Im Projekt SWAG wird das Teilen und Analysieren von Datensätzen mittels kombinierter KI-Methoden entwickelt und erprobt. Der Schwarm besteht hier aus Servern an den fünf Standorten Aachen, Dresden, Heidelberg, Mainz und Würzburg, über die die künstlich erzeugten Modelle ausgetauscht werden. Man teilt nur die Algorithmen und das, was sie am jeweiligen Standort dazulernen. © Bettina Baeßler / UKW

Hier sind erste künstlich erzeugte CT-Bilder vom Bauch zu sehen.

Erste Trainingsergebnisse: Aus zahlreichen echten Patientendaten wurden erste synthetische CT-Aufnahmen vom Abdomen erstellt. © Daniel Truhn / Universitätsklinikum Aachen.