Amerikanische Wissenschaftler haben in einem Review eine Checkliste für ideale Algorithmen im Gesundheitswesen vorgestellt. Sechs Eigenschaften sind laut Aussagen der Forscher dafür notwendig. Von Christoph Berger
„Der Umfang und die Komplexität menschlicher Krankheiten stellen besondere Herausforderungen an die klinische Entscheidungsfindung“, schreiben die Wissenschaftler in der Einleitung ihres Artikels „Ideal algorithms in healthcare: Explainable, dynamic, precise, autonomous, fair, and reproducible“, der im Januar dieses Jahres im Fachjournal „PLOS Digital Health“ erschien. Die 10. Revision des Klassifikationssystems der Internationalen Statistischen Klassifikation der Krankheiten und verwandter Gesundheitsprobleme (ICD) würde etwa 68.000 Diagnosecodes umfassen. Und da Patienten nahezu jede Kombination dieser Diagnosen haben könnten, würden sowohl die Betroffenen als auch die Ärzte unter dem Druck stehen, Entscheidungen zu treffen. Und dies meist unter Zeitdruck und hoher kognitiver Belastung aufgrund der großen Informationsmengen. Algorithmen könnten vor diesem Kontext für Entlastung sorgen. Doch da sie direkte Auswirkungen auf die Gesundheit der Patienten haben, müssen sie auch hohe Qualitätsstandards erfüllen.
Daher braucht es laut den Autoren sechs Eigenschaften, die Algorithmen erfüllen müssen:
- Erklärbar: Die Algorithmen vermitteln, welche Bedeutung sie Merkmalen bei der Bestimmung der Ergebnisse zuordnen.
- Dynamisch: Die Algorithmen können zeitliche Veränderungen physiologischer Signale und klinischer Ereignisse erfassen, können also neue Daten in den Entscheidungsprozess einfließen lassen.
- Präzise: Der Algorithmus verwendet hochaufgelöste und multimodale Daten. Er kann also unterschiedlichste Daten miteinander verknüpfen und kommt so zu einer Entscheidung.
- Autonom: Die Algorithmen lernen möglichst selbstständig und brauchen kaum menschliche Überwachung.
- Fair: Die Algorithmen können Voreingenommenheit und soziale Ungerechtigkeit erkennen und in die Bewertung einfließen lassen.
- Reproduzierbar: Die Algorithmen sind validiert und werden mit der wissenschaftlichen Gemeinschaft geteilt.
Mird scheint eine weiterführende Diskussion über verbindliche Bewertungsmaßstäbe von KI-Systemen in der Medizin notwendig, etwa im Rahmen von Zertifizierungs- oder Zulassungsverfahren.
Damit sind sie überprüf- und reproduzierbar. „Die Autoren rücken einige der „Schmerzpunkte“ der KI-Forschung ins Licht, zum Beispiel Reproduzierbarkeit und Interpretierbarkeit, beides sehr aktive Forschungsfelder in der KI-Forschung. Einige Kategorien sind etwas schwammig definiert und auch nicht alle immer zwingend notwendig – in der Notfalldiagnostik liegt oft nur ein einziger Zeitpunkt vor und der Verlauf ist fürs Erste weniger wichtig. Im Großen und Ganzen ergeben die Kategorien aber Sinn und sind ein guter Leitfaden“, sagt Dr. Anton Becker, Director of Analytics, Body Imaging Service, Memorial Sloan Kettering Cancer Center in New York, Vereinigte Staaten, zu den erarbeiteten Charakteristika.
Prof. Dr. Robert Ranisch, Juniorprofessor für Medizinische Ethik mit Schwerpunkt auf Digitalisierung an der Fakultät für Gesundheitswissenschaften der Universität Potsdam sagt, dass es in den vergangenen Jahren immer wieder Vorschläge gegeben hätte, einheitliche Leitlinien oder Qualitätsstandards für KI und Deep Learning Systeme in der Medizin zu formulieren. Die Checkliste für „ideale“ Algorithmen ordne sich hier ein und stelle damit einen Beitrag zu einer wichtigen Debatte dar. Zugleich müsse sich aber zeigen, wie derartige Vorschläge aufgegriffen würden und wie sich diese in die Praxis übersetzen lassen könnten. Er fordert: „Zudem scheint mir eine weiterführende Diskussion über verbindliche Bewertungsmaßstäbe von KI-Systemen in der Medizin notwendig, etwa im Rahmen von Zertifizierungs- oder Zulassungsverfahren.“