Die erfolgreiche Nutzung generativer KI im Krankenhaus steht und fällt mit der Qualität und Verfügbarkeit der zugrundeliegenden Gesundheitsdaten. Strukturierte, konsistente und vollständige Datensätze ermöglichen es, präzise Analysen zu erstellen und vertrauenswürdige KI-gestützte Entscheidungen zu treffen. Im Folgenden werden die zentralen Anforderungen an Datenqualität, Infrastruktur und skalierbare Lösungen beschrieben.
Für eine effektive Nutzung von KI-Anwendungen im Krankenhaus ist die Integration und Zugänglichkeit von Daten notwendig. Daten sollten aus vielfältigen Quellen stammen, darunter elektronische Patientenakten (EPA), Laborinformationssysteme (LIS), Radiologieinformationssysteme (RIS), bildgebende Verfahren (PACS), klinische Entscheidungsunterstützungssysteme, Sensoren und Wearables sowie administrative Systeme. Auch externe Datenquellen wie Versorgungsdaten, Registerdaten oder genetische Informationen können relevante Ergänzungen liefern. Die Zugänglichkeit der Daten für KI-Modelle erfordert dabei eine zentrale, standardisierte Datenplattform, die strukturierte und unstrukturierte Daten effizient verarbeitet. Dabei sind Datenschutz- und Sicherheitsstandards zwingend einzuhalten. Die Nutzung von Data Lakes oder Health Data Warehouses kann helfen, große Mengen heterogener Daten in strukturierter Form bereitzustellen.
Datenqualität als Grundvoraussetzung
Für den Einsatz generativer KI ist es notwendig, dass Gesundheitsdaten systematisch, standardisiert und möglichst vollständig erfasst werden. Elektronische Patientenakten (ePA) und Initiativen wie der European Health Data Space (EHDS) schaffen durch strukturierte Datenerhebung die Basis für hochwertige Datenbestände. Nur so können Verzerrungen, Fehler und unvollständige Informationen minimiert werden, die andernfalls zu fehlerhaften KI-Ergebnissen führen. Neben der technischen Qualität ist auch die fortlaufende Überprüfung und Validierung der Daten durch klinische Expertinnen und Experten notwendig, um die fachliche Korrektheit sicherzustellen.
Infrastruktur zur Datenaufbereitung
Die technische Infrastruktur muss darauf ausgelegt sein, Daten aus unterschiedlichen Quellen – etwa elektronische Patientenakten, Labor- und Radiologiesysteme, Sensoren oder externe Register – zentral zu integrieren und aufzubereiten. Hierfür sind interoperable Plattformen erforderlich, die strukturierte und unstrukturierte Daten effizient verarbeiten können. Kommunikationsserver und Clinical Data Repositories (CDR) ermöglichen die Zusammenführung und eindeutige Identifikation von Patientendaten aus verschiedenen Systemen und Abteilungen4. Interoperabilitätsstandards wie HL7 FHIR sind dabei unerlässlich, um einen reibungslosen und standardisierten Datenaustausch zu gewährleisten.
Konzeption und Umsetzung von Daten-Pipelines und Speichersystemen
Daten-Pipelines müssen so gestaltet sein, dass sie Daten aus den Quellsystemen extrahieren, in ein einheitliches, KI-fähiges Format transformieren und zentral speichern (ETL-Prozesse). Für die Speicherung eignen sich Data Lakes (für Rohdaten, hohe Flexibilität und Skalierbarkeit) oder spezialisierte Health Data Warehouses (für strukturierte, bereinigte Daten mit schneller Abfrageleistung). Die Wahl hängt von den jeweiligen Anforderungen und dem erwarteten Datenvolumen ab. Wichtig ist, dass die Systeme skalierbar sind, um das stetig wachsende Volumen medizinischer Daten zu bewältigen.
Tools zur Integration und Skalierbarkeit
Zur Integration von Informationen aus unterschiedlichen Quellen sind standardisierte Schnittstellen und klare Regelungen zur Datenfreigabe notwendig, um Insellösungen zu vermeiden und den Datenschutz zu gewährleisten. Skalierbare Lösungen wie moderne Cloud-Plattformen, modulare Data-Lake-Architekturen und leistungsfähige Kommunikationsserver bilden die Basis, um mit dem exponentiellen Datenwachstum Schritt zu halten und Innovationen wie KI nachhaltig zu unterstützen.
Präzise Diagnosen, effiziente Prozesse und bessere Patientenversorgung
Generative KI-Modelle, insbesondere große Sprachmodelle (LLM), können nur so zuverlässig sein wie die Daten, mit denen sie trainiert wurden. Verzerrte, unvollständige oder fehlerhafte Daten führen zu ungenauen oder sogar gefährlichen Empfehlungen. Deshalb ist es entscheidend, dass die Datenquellen streng kuratiert und kontinuierlich von klinischen Experten überprüft werden. So kann das Vertrauen in KI-gestützte Entscheidungsunterstützung aufgebaut und erhalten werden. Durch hochwertige, interoperabel aufbereitete und zentral verfügbare Gesundheitsdaten kann generative KI im Krankenhaus ihr Potenzial entfalten. Eine skalierbare, sichere und standardisierte IT-Infrastruktur ist dafür unverzichtbar als Grundlage für präzise Diagnosen, effiziente Prozesse und eine bessere Patientenversorgung.
Autor: Wolf-Dietrich Lorenz
Foto: Adobe Stock / khunkornStudio