Wenn Künstliche Intelligenz auf High-Performance Computing trifft

KI

Veröffentlicht 19.03.2021 10:10, Dagmar Finlayson

Künstliche Intelligenz spielt in der Diagnostik, der Medikamentenentwicklung, der Personalisierung von Behandlungen oder der Genom-Editierung eine entscheidende Rolle. Viele der heutigen und zukünftigen Einsatzszenarien im Medizin- und Biotechnologie-Umfeld erfordern dabei Rechenleistungen, die über das übliche Maß hinausgehen. High-Performance Computing ist somit ein wesentlicher Grundpfeiler für jede KI-Innovation.

Die Welt der Präzisionsmedizin entwickelt sich seit einigen Jahren rasant. Bereits heute unterstützt Künstliche Intelligenz (KI) die Fernüberwachung von Patienten, verbessert Therapieangebote durch intelligente Entscheidungssysteme, vereinfacht die Bildgebung und hilft damit Radiologen, fundiertere klinische Entscheidungen zu treffen und so die für die Diagnose erforderliche Zeit zu verkürzen. KI ist längst zum unverzichtbaren Instrument in allen Bereichen des Gesundheitswesens geworden. Ein Segment, das in den letzten Jahren an Bedeutung gewonnen hat, ist die Genomik. Eine der Hauptanwendungen der Genomsequenzierung, die die Abbildung der individuellen DNA einer Person umfasst, ist die Erkennung und Behandlung von Krebs. Durch die Sequenzierung des gesamten Genoms eines Patienten können Ärzte hyperpersonalisierte Behandlungen vorschlagen, die an die genetischen Eigenschaften jedes Patienten angepasst sind und so die medizinische Versorgung sowie den Krankheitsverlauf deutlich verbessern.

Der erfolgreiche KI-Einsatz im Gesundheitswesen basiert – genauso wie in vielen anderen Bereichen – auf Big Data. Eine einzige CT- oder MRT-Untersuchung kann beispielsweise mehrere hundert Images produzieren, bei einem Dünnschicht-Image-Scan sind es sogar tausende. Das führt dann zu Dateien in der Größenordnung von mehreren hundert Gigabyte. Viele dieser Daten liegen unstrukturiert – beispielsweise als Bilder, Videos, Skizzen oder Notizen – vor und sind im Netzwerk verteilt, was eine gezielte und effiziente Nutzung und Analyse deutlich erschwert. Hier kommt einerseits KI ins Spiel: Nur so lassen sich enorme Datenmengen auswerten, um daraus neue Erkenntnisse zu gewinnen. Andererseits spielt High-Performance Computing (HPC) eine entscheidende Rolle, um die für die KI-Rechenvorgänge benötigte Leistung und Speichermenge bereitzustellen. Gerade neuronale Netze mit Deep-Learning-Funktion sind von Natur aus parallel strukturiert, was hervorragend zu hochparallelen HPC-Systemen passt.

KI-Leistung für alle

Moderne HPC-Lösungen überzeugen in zweierlei Hinsicht: Datenanalytik und Bereitstellung. Bei der Analyse großer Mengen unstrukturierter Daten, deren Volumen und Geschwindigkeit nahezu exponentiell zunimmt, kommen traditionelle IT-Infrastrukturen aufgrund zu langsamer Speichergeschwindigkeiten sofort an ihre Grenzen. Um sehr große Datensätze verarbeiten zu können, setzen Forschungseinrichtungen beispielsweise auf sogenannte Exascale-Systeme, die eine Quintillion – oder anders formuliert 1018 – Gleitkommaberechnungen pro Sekunde durchführen können und damit fünfmal schneller sind als der derzeit leistungsstärkste Supercomputer der Welt. Mit solchen Systemen können Simulationen von großer Genauigkeit und sehr detaillierte Einblicke in viele relevante Prozesse erreicht werden. Damit ist eine schnellere Entwicklung von wirksamen Medikamenten oder die rasche Erkennung von Pandemien möglich. In Zusammenarbeit mit Intel und der Universität Cambridge, die einen der leistungsstärksten Supercomputer Großbritanniens beherbergt, hat Dell Technologies beispielsweise das Open Exascale Lab ins Leben gerufen. Das Labor, dessen Ziel die Förderung von Innovationen und die Erforschung neuer Exascale-Technologien ist, ermöglicht es allen Beteiligten in diesem Umfeld gemeinsam an HPC-Systemen der nächsten Generation zu arbeiten.

Das führt gleich zum zweiten Punkt, der Bereitstellung von KI-Implementierungen zu vertretbaren Kosten. Obwohl die Möglichkeiten der KI vielversprechend sind, ist die Realisierung einer KI-Lösung keine einfache Aufgabe. Im Gegenteil – immer größer werdende Datensätze und komplexere Algorithmen erhöhen gleichzeitig den Bedarf nach einer entsprechend performanten und damit letztlich bis vor kurzem auch teuren Infrastruktur sowie einer ausgewiesenen Inhouse-Expertise. Beides werden die meisten Unternehmen angesichts begrenzter Budgets und personeller Engpässe nicht selbst handhaben können. Hier helfen Referenzarchitekturen mit eigens validierten und in kurzer Zeit einsatzfähigen Paketlösungen weiter, die durch die Kombination aus Rechner-, Speicher- und Netzwerkkapazitäten sowie passender Frameworks und Bibliotheken die Einführung neuer KI-Anwendungen vereinfachen und beschleunigen. Damit haben die eigenen Experten mehr Zeit für das eigentliche Experimentieren und Anpassen von Modellen.

Grundlage auf Hardware-Seite sind neben All‐Flash‐Scale‐out‐NAS‐Speichern spezielle HPC-Server oder -Workstations, deren CPUs und GPUs sich für komplexe Anwendungsszenarien des Machine und Deep Learning in der Bildverarbeitung eignen. Die Kombination ermöglicht eine Leistungssteigerung bei gleichzeitiger Beseitigung von I/O‐Engpässen und erlaubt damit den schnellen Zugriff auf größere Datensätze, um die Modellgenauigkeit zu verbessern. Die Generierung und Speicherung von Daten ist teuer, und viele Daten gerade in Krankenhäusern und anderen Einrichtungen des Gesundheitswesens werden immer noch in nicht-digitaler Form aufbewahrt. Ein Großteil der vorhandenen Daten ist also inkompatibel und wird in Silos statt in einer gemeinsamen Datenstruktur gespeichert. Deshalb ist eine neue Datenarchitektur erforderlich, die die Aggregation von Daten unterstützt und eine einheitliche Datenanalyse ermöglicht. Eine Technologie für das effiziente Erschließen von Daten sind beispielsweise das Hadoop Distributed File System (HDFS) und das zugehörige Ökosystem an Werkzeugen. Hadoop ist eine kosteneffiziente Lösung für das Speichern und Verarbeiten von Big Data, insbesondere von semistrukturierten und unstrukturierten Daten, die aus unterschiedlichen Quellen wie Dokumenten, Videos sowie Bildern aller Art stammen.

Komplettpakete beschleunigen die KI-Umsetzung

Wie sehr solche Komplettpakete die medizinische Behandlung verbessern können, zeigt das Beispiel des gemeinnützigen Translational Genomics Research Institute (TGen). Als das TGen 2008 erstmals Sequenziermethoden der nächsten Generation einführte, nahm die Verarbeitung durch einen Supercomputer ungefähr zwei Wochen in Anspruch – eine Ewigkeit für die Verwendung in einer klinischen Umgebung. Heute nutzt das Institut die Dell EMC Ready Solution for HPC Genomics und konnte durch den modularen Ansatz das Zeitfenster auf unter acht Stunden verkleinern. In dieser kurzen Zeit wird die Genomprobe verarbeitet, die Ursache für die Krankheit identifiziert und eine Behandlungsmethode entwickelt, die für den Patienten den größten Nutzen bringt. Auch bei der gegenwärtig besonders wichtigen Forschung an dem neuen Coronavirus, das für die Covid-19-Pandemie verantwortlich ist, kommen Genanalysen zum Einsatz, um das Virus besser zu verstehen.

Lange Zeit wurde HPC als eine Art akademische Technologie gesehen, die ihren Platz in der Forschung hat. Doch die Hochleistungsrechner von heute können jedem Unternehmen helfen, neue Geschäftsfelder zu erschließen. Möglich wurde das durch sinkende Hardware-Preise, innovative Software-Konzepte und allem voran durch eigens validierte und in kurzer Zeit einsatzfähige Paketlösungen. Bis vor Kurzem noch mussten Firmen die für KI-Projekte benötigte Hard- und Software als einzelne Komponenten beschaffen und anschließend sehr aufwändig und langwierig zusammenführen, konfigurieren und optimal aufeinander abstimmen. HPC wird die KI beschleunigen, verbessern und auf ein neues Niveau heben. Erst die Kombination aus beiden Technologien macht es möglich, Daten in Minuten oder Stunden und nicht mehr in Tagen oder Wochen zu analysieren.

Autor: Benjamin Krebs, Senior Director & General Manager Enterprise bei Dell Technologies Deutschland

Foto: Adobe Stock / pinkeyes


Lesen Sie mehr zum Thema "KI & Robotik"

Lesen Sie hier die neuesten Beiträge