Skip to Content
Direkteinstieg

Die TUM präsentiert die

Summer School on HPC Driving AI

Seien Sie vom 16. bis 20. Juni 2026 dabei und erweitern Sie Ihr Wissen über fortschrittliche HPC- und KI-Technologien, entwickeln Sie Lösungen für reale wissenschaftliche Herausforderungen und arbeiten Sie direkt mit führenden Experten zusammen. Ein intensives Programm für Forschung, Innovation und internationales Networking, angeboten von einer der führenden technischen Universitäten Europas – der Technischen Universität München – auf dem Bildungscampus Heilbronn.

Programm

16:00 Uhr– 21:00 Uhr

Begrüßung und Get-together mit Stehdinner

 
07:00 – 07:30 UhrMorgendliches Training 
 
08:00 – 09:00 UhrSchlaues Frühstück 
 
09:00 – 12:00 Uhr

Vom Code zum Silizium: Ein Transformer auf dem Weg durch die JAX & XLA Compiler-Pipeline.

Während moderne Machine-Learning-Frameworks das Modelldesign von der Hardwarekomplexität entkoppeln, erfordert das Erreichen von Spitzenleistungen auf modernen Beschleunigern ein tiefes Verständnis der Compiler-Pipeline, die symbolische Graphen in Maschinenbefehle übersetzt. Geleitet von einem Google GPU-Compiler-Ingenieur schlägt dieser dreistündige Praxis-Workshop die Brücke zwischen High-Level-Modellarchitekturen und der Bare-Metal-GPU-Ausführung.

Anhand eines GPT-Transformers auf Zeichenebene (Character-level GPT) werden die Teilnehmer die Reise eines Modells vom Python-Code bis hin zum physischen Silizium implementieren und nachverfolgen. Unter Verwendung vortrainierter Gewichte zur Umgehung von Trainingslatenzen werden wir JAX und Google Colab nutzen, um jede Phase der Kompilierungspipeline systematisch zu analysieren.

 

Kerninhalte:

  • JAX Tracing: Überführung (Lowering) von Python-Code in die typisierte JAX-Zwischenrepräsentation (Jaxpr).
  • StableHLO & HLO IR: Analyse, wie High-Level-Operationen auf portable, hardwareunabhängige Tensoralgebra abgebildet werden.
  • XLA-Optimierungsdurchläufe: Dekonstruktion algebraischer Vereinfachungen und kritischer Loop-Fusion-Durchläufe, die skalierbare Workloads wie Gemini, AlphaFold und Waymo beschleunigen.
  • GPU-Codegenerierung: Untersuchung des final kompilierten Low-Level GPU-Assemblys (PTX/LLVM IR), um zu sehen, wie der Compiler Speicher und Threads auf das Silizium mappt.

 

Am Ende dieser Session werden die Teilnehmer eine Systemperspektive auf Deep-Learning-Compiler gewonnen haben, die sie befähigt, Modelle zu entwerfen, die von Natur aus auf hardwarespezifische Optimierungen ausgerichtet sind.

Dirk Hornung

Dirk Hornung ist GPU-Compiler-Ingenieur bei Google, wo er am XLA (Accelerated Linear Algebra) Compiler-Ökosystem arbeitet. Bevor er sich der Optimierung auf Siliziumebene widmete, promovierte Dirk in Physik an der Universitat Autònoma de Barcelona mit Fokus auf die Präzisionsbestimmung von Parametern des Standardmodells. Heute arbeitet er an der Spitze der Hardware-Beschleunigung und entwirft Compiler-Codegenerierung und Performance-Optimierungen für Googles größte KI-Anwendungen, darunter Gemini, AlphaFold und die autonome Fahrsoftware von Waymo.

 
12:00 – 13:00 UhrMittagessen 
 
13:00 – 16:00 Uhr

Mikroarchitekturen und zukünftige Computertechnologien

  • 13:00 – 13:30: Einführung in moderne HPC-Architekturen (High-Performance Computing)
  • 13:30 – 14:00: Panel-Diskussion über zukünftige HPC-Architekturen
  • 14:00 – 16:00: Hands-on Session zu OpenMP

Michael Klemm

Dr. Michael Klemm ist Principal Member of Technical Staff im Team für Compiler, Sprachen, Runtimes & Tools der Machine Learning & Software Engineering Gruppe bei AMD. Er ist der leitende Architekt des AMD Fortran-Compilers für AMD-GPUs. Michael ist zudem Geschäftsführer des OpenMP Architecture Review Board und Lehrbeauftragter am Lehrstuhl für Rechnerarchitektur und Parallele Systeme der Technischen Universität München (TUM). Er hält einen M.Sc. in Informatik und einen Doktortitel (Dr.-Ing.) in Informatik von der Friedrich-Alexander-Universität Erlangen-Nürnberg. Sein Forschungsschwerpunkt liegt auf Compilern und Runtime-Optimierungen für verteilte Systeme.

 

Amir Raoofy

Amir ist Forscher in der Gruppe für Future Computing und Energieeffizienz am Leibniz-Rechenzentrum (LRZ) und als Postdoktorand mit der Technischen Universität München (TUM) verbunden. Er promovierte 2024 (Dr. rer. nat.) am Lehrstuhl für Rechnerarchitektur und Parallele Systeme der TUM, wo er sich mit der Nutzung von High-Performance Computing für großangelegte Datenanalysen befasste. Seine Forschungsinteressen umfassen Systemsoftware und -programmierung, intelligentes Networking in HPC, Architekturbewertungen sowie Programmiermodelle.

 
16:00 – 16:30 UhrKaffeepause 
 
16:30 – 19:00 UhrTutorial zu verteiltem GPU-ComputingMathis Bode
Jülich Supercomputing Centre
 
07:00 – 07:30 UhrMorgendliches Training 
 
08:00 – 09:00 UhrSchlaues Frühstück 
 
09:00 – 10:00 Uhr

Im Inneren eines LLM: Ein praktischer Performance-Deep-Dive mit TinyLlama

Dieser Vortrag stellt die wichtigsten rechnerischen Bausteine von Large Language Models (LLMs) und Transformer-Architekturen vor, mit besonderem Fokus auf deren Performance-Verhalten und typische Engpässe. Anhand eines kleinen Referenzmodells durchlaufen wir einen praktischen Ansatz zum Profiling von KI- und HPC-Workloads auf modernen GPUs. Wir zeigen, wie typische Leistungsgrenzen identifiziert und durch Optimierungen behoben werden können, die auch aktuellen großskaligen Transformer-Architekturen zugrunde liegen.

Marius Kurz

Marius Kurz ist MTS Software Applications Engineer bei AMD mit einem Hintergrund in numerischer Strömungsmechanik (CFD) und konvergentem HPC/KI. Er unterstützt und optimiert großskalige HPC- und KI-Workloads auf AMD-GPUs, mit Schwerpunkt auf Performance-Profiling, Optimierung und Skalierbarkeit.

 
10:00 – 11:00 Uhr

Leistungsportables, heterogenes Computing mit SYCL in ROOT etablieren

Moderne wissenschaftliche Datenanalysen stützen sich zunehmend auf heterogene Rechenzentren – CPUs, GPUs und neuartige Beschleuniger –, um den stetig wachsenden Leistungsbedarf zu decken. Dies gilt insbesondere für Analysen in der Hochenergiephysik, da der kommende High-Luminosity Large Hadron Collider (HL-LHC) beispiellose Datenmengen zur Verarbeitung liefern wird. Um mit dieser Skalierung Schritt zu halten, müssen sich langlebige Software-Ökosysteme wie ROOT weiterentwickeln, ohne die Codebasis zu fragmentieren oder Benutzer mit gerätespezifischer Komplexität zu belasten. Dieser Vortrag präsentiert unsere Erfahrungen bei der Integration von SYCL in die ROOT-Bibliothek im breiteren Kontext des europäischen SYCLOPS-Projekts. Ziel ist es, eine leistungsportable, heterogene Ausführung für zentrale Workloads zu ermöglichen, einschließlich großskaliger Datenvorverarbeitung und hybrider Physik-KI-Pipelines. Wir diskutieren die Leitprinzipien dieses Vorhabens, praktische Herausforderungen und deren Bewältigung anhand konkreter Beispiele aus den ROOT-Komponenten. Durch das Teilen gewonnener Erkenntnisse und Performance-Ergebnisse soll dieser Vortrag zeigen, wie SYCL als praktikabler und nachhaltiger Weg zur Modernisierung großer wissenschaftlicher Software-Frameworks dienen kann, um aktuelle und zukünftige Computing-Plattformen vollständig auszuschöpfen.

Monica Dessole

Monica Dessole ist Gastwissenschaftlerin am NATO Center for Maritime Research and Experimentation (CMRE) und spezialisiert auf High-Performance und heterogenes Computing für numerische Modellierung. Zuvor war sie als Research Fellow am CERN tätig und leistete Beiträge zum ROOT-Framework mit Fokus auf leistungsportable C++-Abstraktionen und SYCL-basierte Beschleunigung für Anwendungen in der Hochenergiephysik. Sie promovierte in Computermathematik an der Universität Padua, wo sie lineare Algebra-Algorithmen für parallele Architekturen untersuchte.

 

 
11:00 – 12:00 Uhr

RIKEN, R-CCS und Fugaku(NEXT): Die weltbesten Supercomputer zur Bewältigung von SDG-Herausforderungen mit KI

Dieser Vortrag beleuchtet die Roadmap von RIKEN zur Nutzung von Fugaku und dem zukünftigen FugakuNEXT, um globale SDGs (Ziele für nachhaltige Entwicklung) und Japans drängende wissenschaftliche Herausforderungen in den Bereichen Katastrophenvorhersage, Gesundheitswesen und Klimaneutralität zu bewältigen. Wir stellen das RIKEN Center for Computational Science (R-CCS), Fugakus einzigartige Arm-SVE-Architektur sowie unsere Pläne für eine großskalige Konvergenz von KI und HPC vor. Zu den Themen gehören die Portierung massiver KI-Modelle auf Fugaku und unser Weg zu einer vollumfänglichen KI-Plattform, die effizientes Model Serving, Echtzeit-Inferenz und Surrogate-Modellierung in großem Maßstab ermöglicht. Abschließend enthüllen wir die Architektur von FugakuNEXT, die im Co-Design entwickelt wird, um in vier Jahren die HPC- und KI-Inferenz-Anforderungen der japanischen Wissenschaftsgemeinschaft zu bedienen.

 

Jens Domke

Jens Domke ist Team Principal des Supercomputing Performance Research Teams am RIKEN Center for Computational Science (R-CCS), Japan. Er promovierte 2017 an der Technischen Universität Dresden für seine Arbeit zu HPC-Routing-Algorithmen und Interconnects. Jens begann seine Karriere im HPC-Bereich 2008, nachdem er mit einem Team von fünf Studenten der TU Dresden und der Indiana University den Student Cluster Competition auf der SC08 gewonnen hatte. Seitdem hat er Dutzende von Peer-Review-Artikeln in Fachzeitschriften und Konferenzbänden veröffentlicht. Er trug die Routing-Algorithmen DFSSSP und Nue zum Subnet Manager von InfiniBand bei und baute den ersten großskaligen HyperX-Prototyp am Tokyo Institute of Technology. Seine Forschungsinteressen umfassen System-Co-Design, Performance-Evaluierung, Extrapolation und Modellierung, Verbindungsnetzwerke sowie die Optimierung paralleler Anwendungen und Architekturen.

 

 
12:00 – 13:00 UhrMittagessen 
 
13:00 – 14:00 Uhr

Die Endlosschleife: Warum HPC das Fundament und die Zukunft der Künstlichen Intelligenz ist

Moderne KI ist nicht in einem Vakuum entstanden; sie wurde im Feuer des High-Performance Computing (HPC) geschmiedet. Von den grundlegenden mathematischen Bibliotheken, die jedem neuronalen Netzwerk zugrunde liegen, bis hin zu den massiven Parallelisierungsstrategien, die ursprünglich für physikalische Simulationen entwickelt wurden – die DNA von HPC ist heute mit jedem erfolgreichen Modell verwoben. Dieser Vortrag untersucht, warum die HPC-Expertise in den Bereichen Skalierbarkeit, Interconnects und Speicheroptimierung der einzig zukunftsweisende Weg ist, da KI nun Maßstäbe von einer Billion Parametern erreicht. Die Beziehung beruht jedoch mittlerweile auf Gegenseitigkeit: Wir schließen mit der Wendung, wie KI ihren Ursprung neu belebt, indem sie traditionelle Simulationen durch neuronale Surrogate (Ersatzmodelle) beschleunigt und die Verwaltung der komplexesten Infrastruktur der Welt automatisiert.

 

Fernanda Foertter

Executive Director, High Performance Computing and Data Center Abteilung für Forschung
The University of Alabama

 
14:00 – 15:00 Uhr

Differenzierbare Simulationen

Physikbasierte Simulationen sind seit langem ein Eckpfeiler in Bereichen wie Ingenieurwesen, Energiesystemen, Strömungsmechanik und Materialdesign, wo First-Principles-Modelle Interpretierbarkeit, Zuverlässigkeit und eine starke induktive Struktur bieten. Gleichzeitig ist in den letzten Jahren ein wachsender Trend hin zu KI-basierten Surrogate-Modellen zu beobachten, die komplexe physikalische Prozesse mit stark reduziertem Rechenaufwand annähern und so schnellere Vorhersagen, Steuerungen und Optimierungen ermöglichen. Differenzierbare Simulationen führen diese beiden Paradigmen zusammen: Sie kombinieren die Struktur und das Fachwissen traditioneller Simulatoren mit gradientenbasierten Lern- und Optimierungstechniken aus dem modernen maschinellen Lernen. Indem man Simulationen End-to-End differenzierbar macht, kann man Modellparameter kalibrieren, inverse Probleme lösen, Steuerungsstrategien erlernen und physikalische Modelle direkt in Trainingspipelines einbetten. Diese Vorlesung führt in die Grundlagen differenzierbarer Simulationen ein, diskutiert praktische Implementierungsaspekte in PyTorch und adressiert wichtige konzeptionelle Herausforderungen, einschließlich der Verwendung von Ersatzfunktionen für Gleichungen oder Operatoren, die von Natur aus nicht differenzierbar sind. Als roter Faden dienen Optimierungsprobleme in solarthermischen Kraftwerken (CSP), an denen wir veranschaulichen, wie differenzierbare Simulationen das Design, den Betrieb und die Steuerung komplexer Energiesysteme unterstützen können.

 

Markus Götz
Affiliation Karlsruhe Institute of Technology

 

 
15:00 – 16:00 Uhr

Automatische Differenzierung für wissenschaftliches Rechnen

Wissenschaftliches Rechnen erfordert sowohl einen "HPC-First"-Ansatz als auch die Integration moderner Techniken wie maschinelles Lernen. Dabei wollen wir ML in das wissenschaftliche Rechnen integrieren, anstatt es komplett zu ersetzen. Das Training von in Modelle eingebetteten ML-Ansätzen erfordert, dass wir Gradienten mittels automatischer Differenzierung aus diesen Modellen extrahieren – und somit auch über HPC-Paradigmen wie MPI und CUDA hinweg.

 

Valentin Churavy
University of Augsburg
 
16:00 – 16:30 UhrKaffeepause 
 
16:30 – 19:00 UhrTutorial zu verteiltem GPU-ComputingMathis Bode
Jülich Supercomputing Centre
 
20:00 – 21:00 Uhr

Öffentlicher Vortrag: Von der Simulation zum Lernen: KI und HPC für die Wetter- und Klimavorhersage

Jüngste Fortschritte im maschinellen Lernen verändern die Wetter- und Klimavorhersage grundlegend. Datengetriebene Modelle wie FourCastNet, GenCast, AIFS und andere aufstrebende generative Ansätze konkurrieren nun mit der traditionellen numerischen Wettervorhersage (NWP) oder ergänzen diese, indem sie schnellere Vorhersagen liefern und gleichzeitig komplexe atmosphärische Dynamiken erfassen. Gleichzeitig verdeutlichen Initiativen wie WeatherGenerator und NVIDIA Earth-2 eine breitere Vision: den Aufbau KI-gestützter digitaler Zwillinge des Erdsystems, die Wetter-, Klima- und Umweltprozesse in einer beispiellosen Größenordnung integrieren. Dieser Vortrag untersucht die Schnittmenge dieser Entwicklungen mit dem High-Performance Computing (HPC). KI-Workloads verändern sowohl Software- als auch Hardware-Stacks auf modernen Supercomputern: Beschleunigerzentrierte Architekturen, Mixed-Precision-Training, verteilte Deep-Learning-Frameworks und skalierbare I/O-Pipelines für gewaltige geophysikalische Datensätze werden zu zentralen Designaspekten. Umgekehrt bleibt HPC-Expertise entscheidend für die Skalierung von Training und Inferenz, die Integration hybrider KI-Physik-Workloads und die Ermöglichung robuster Deployments. Wir diskutieren Implementierungsaspekte und praktische Herausforderungen anhand von FourCastNet3 und transformerbasierten Modellen als konkrete Beispiele. Insbesondere untersuchen wir Architekturtrends, Skalierungsverhalten und die Auswirkungen moderner GPU-Funktionen auf wissenschaftliche KI-Workloads. Abschließend skizzieren wir offene Herausforderungen und zukünftige Richtungen, einschließlich der Kopplung von KI-Modellen mit Beobachtungsdaten, der Ausweitung von Methoden auf klimatische Zeitskalen und der Verbesserung der physikalischen Konsistenz und Zuverlässigkeit. Die Konvergenz von KI und HPC beschleunigt nicht nur die Wettervorhersage, sondern definiert auch neu, wie Erdsystemwissenschaft betrieben wird.

 

Thorsten Kurth

Thorsten arbeitet bei NVIDIA, wo er sich auf die Optimierung wissenschaftlicher Anwendungen für GPU-basierte Supercomputer konzentriert. Im Mittelpunkt seiner Arbeit steht die Entwicklung von hochperformanten Deep-Learning-Lösungen für HPC-Systeme, einschließlich End-to-End-Optimierungen wie Input-Pipelines, I/O-Tuning und verteiltem Training, das Datenparallelität mit Modellparallelität über mehrere Dimensionen hinweg nutzt. Im Jahr 2018 wurde er mit dem Gordon Bell Prize ausgezeichnet, da er die erste Deep-Learning-Anwendung leitete, die auf dem OLCF-Summit-System eine Spitzenleistung von über 1 ExaOp erreichte. Im Jahr 2020 erhielt er den Gordon Bell Special Prize für HPC-basierte COVID-19-Forschung, eine Anerkennung für seine Arbeit an der Generierung großer Ensembles von Spike-Trimer-Konformationen mithilfe des KI-gesteuerten Molekulardynamik-Workflows DeepDriveMD. In jüngerer Zeit konzentriert sich seine Arbeit auf generative Wettervorhersagen und trägt zur Entwicklung des FourCastNet-Modells bei.

 
07:00 – 07:30 UhrMorgendliches Training 
  
08:00 – 09:00 UhrSchlaues Frühstück 
 
09:00 – 12:00 Uhr

HPC-gestützte Visualisierung

Visualisierung ist eine Schlüsselkomponente für die effektive Analyse und Interpretation von großskaligen Simulationsdaten, die von High-Performance-Computing-Systemen (HPC) erzeugt werden. Insbesondere immersive und interaktive Visualisierungsansätze, einschließlich Virtual Reality (VR), bieten neue Möglichkeiten, komplexe, hochdimensionale Datensätze zu verstehen, die in den computergestützten Natur- und Ingenieurwissenschaften zunehmend alltäglich werden.

Dieses dreistündige Summer-School-Modul führt die Teilnehmer in hochmoderne Visualisierungs-Workflows für HPC-Umgebungen ein, mit Schwerpunkt auf immersiver Visualisierung und skalierbaren, modularen Frameworks.

Der Kurs beginnt mit einem Überblick über die Rolle von Virtual Reality in der HPC-Visualisierung und behandelt grundlegende Konzepte, typische Anwendungsfälle sowie Herausforderungen in Bezug auf Performance, Datenmanagement und Benutzerinteraktion. Anschließend werden die Teilnehmer durch die Einrichtung containerisierter Visualisierungsumgebungen mit Docker geführt, was eine reproduzierbare und portable Bereitstellung komplexer Visualisierungs-Software-Stacks ermöglicht.

Den Kern des Moduls bildet eine Hands-on Session zu den vom HLRS entwickelten Visualisierungs-Frameworks Covise und Vistle, die für die interaktive, verteilte und immersive Visualisierung großer Simulationsdatensätze weit verbreitet sind.

Durch praktische Übungen sammeln die Teilnehmer Erfahrungen in der Konfiguration von Visualisierungs-Pipelines, der Anbindung an HPC-Datenquellen und der interaktiven Datenexploration sowohl in Desktop- als auch in immersiven Umgebungen. Das Modul richtet sich an Doktoranden und Nachwuchswissenschaftler und setzt eine einsatzbereite Docker-Umgebung voraus.

Am Ende der Session werden die Teilnehmer mit dem praktischen Wissen und den Werkzeugen ausgestattet sein, um fortschrittliche Visualisierungstechniken in HPC-basierte Forschungs-Workflows zu integrieren.

  • 09:00 – 09:30: Einführung in Virtual Reality für HPC
  • 09:30 – 10:00: Einrichtung der Docker-Container
  • 10:00 – 10:10: Kaffeepause
  • 10:10 – 12:00: Hands-on Session für Covise/Vistle
Uwe Wössner, Martin Aumüller, Johannes Gebert
HLRS
 
12:00 – 13:00 UhrMittagessen 
 
13:00 – 16:00 Uhr

JUPITER: Treiber für KI und Simulation auf Exascale-Niveau in Europa Mathis Bode
JUPITER ist der erste europäische Exascale-Supercomputer und wird am Jülich Supercomputing Centre (JSC) am Forschungszentrum Jülich betrieben. Mit rund 24.000 NVIDIA GH200 Superchips bietet JUPITER eine einzigartige Umgebung für Extreme-Scale-KI und -Simulation. Diese Präsentation gibt einen detaillierten Überblick über JUPITER, beschreibt sein Betriebsmodell und fasst erste wissenschaftliche Erfolgsgeschichten zusammen. Es wird zudem beschrieben, wie JUPITER als Teil der JUPITER AI Factory (JAIF) zu einer KI-optimierten Rechenplattform ausgebaut wird. Ein wesentlicher Bestandteil dafür ist, neben zahlreichen KI-Diensten, das integrierte Inferenz-Modul JARVIS, das die sichere, souveräne und skalierbare Bereitstellung von KI-Anwendungen ermöglichen wird.

 

Jacob Finkenrath: PLEGMA mit QUDA: Ein Blick auf die Struktur der Nukleonen
Großskaliges Computing kann als Mikroskop genutzt werden, um die Struktur von Hadronen genauer zu untersuchen. Supercomputer ermöglichen es uns, die starke Wechselwirkung zu simulieren – die Kernkraft, die Quarks und Gluonen innerhalb von Hadronen zusammenhält. Die Eigenschaften von Protonen und Neutronen, aus denen die Kerne aller Atome bestehen, können mittels Gitter-QCD (Lattice QCD), einer diskretisierten Quantenfeldtheorie, simuliert werden. Die Berechnungen werden umso präziser, je feiner die Diskretisierung (der Gitterabstand) wird. Für unsere neuesten Messungen bei unserem bisher feinsten Gitterabstand haben wir das EAP von Jupiter genutzt. In diesem Vortrag werde ich unsere rechnerischen Herausforderungen diskutieren und aufzeigen, wie Jupiter uns dabei helfen wird, die nächsten Schritte zur Vertiefung unseres Verständnisses der Kernstruktur zu gehen.
 

Mathis Bode, Jacob Finkenrath
Jülich Supercomputing Centre
 
13:00 – 16:00 Uhr

GPU-zentriertes Supercomputing auf Jupiter

 

Hendrik Nicolai: NekCRF: Erfassung turbulenter Wasserstoffverbrennung in Gasturbinen-Brennkammern auf Exascale-Niveau

Wasserstoff und andere erneuerbare Brennstoffe weisen ein grundlegend anderes Verbrennungsverhalten auf, was kritische Limitationen in bestehenden Modellen offenbart, die für hochgenaue (High-Fidelity) Simulationen reaktiver Strömungen ungeeignet sind. Um diese Herausforderungen zu bewältigen, müssen neue, physikalisch fundierte Verbrennungsmodelle entwickelt werden. Gleichzeitig erfordern sich weiterentwickelnde HPC-Architekturen eine neue Generation von CFD-Software, die für massiv parallele, GPU-zentrierte Plattformen optimiert ist, um die entstehenden Rechenkapazitäten voll auszuschöpfen.

Mithilfe des neuartigen GPU-beschleunigten Spektralelement-Lösers NekCRF führen wir großskalige direkte numerische Simulationen (DNS) mit Finite-Rate-Chemie auf modernen heterogenen HPC-Architekturen durch. Der Löser wurde speziell für Exascale-Systeme entwickelt, wobei alle Komponenten – einschließlich Strömungslöser, Transportoperatoren und insbesondere die thermochemische Integration – vollständig für eine effiziente Ausführung auf GPUs optimiert sind.

NekCRF nutzt Spektralelement-Diskretisierungen höherer Ordnung in Kombination mit GPU-nativen Algorithmen, um die arithmetische Intensität zu maximieren und Speicherbewegungen zu minimieren, was eine exzellente Skalierbarkeit über eine große Anzahl von Beschleunigern hinweg gewährleistet. Besonderes Augenmerk liegt auf der Behandlung steifer chemischer Quellterme, bei denen maßgeschneiderte Datenlayouts, Kernel-Fusion und optimierte Integrationsstrategien eine effiziente Nutzung der GPU-Ressourcen ohne Kompromisse bei der numerischen Genauigkeit ermöglichen.

Die resultierenden Simulationen dienen als High-Fidelity-Benchmark-Datensätze für die Entwicklung und Validierung von numerischen Methoden und Modellen der nächsten Generation. Im weiteren Sinne demonstriert diese Arbeit, wie eng verzahntes algorithmisches Design und hardwarebewusste Implementierung den Stand der Technik im großskaligen wissenschaftlichen Rechnen erheblich vorantreiben können, wodurch Simulationen in Auflösungen und Genauigkeiten ermöglicht werden, die zuvor unerreichbar waren.

 

Jan Frederik Engels: ICON: Effiziente Simulation des gesamten Erdsystems mit 1 km Auflösung Jan Frederik Engels

Die Simulation des gesamten Erdsystems erfordert eine explizite Darstellung der eng gekoppelten Energie-, Wasser- und Kohlenstoffströme über alle dynamisch relevanten räumlichen und zeitlichen Skalen hinweg. Insbesondere die Erfassung der Energie- und Wasserkreisläufe erfordert die Auflösung konvektiver Instabilität. Dies impliziert eine kilometergenaue Auflösung mit Gitterabständen in der Größenordnung von 1 km, um diese Prozesse explizit statt parametrisch darzustellen. Um diese Herausforderung zu meistern, müssen mehrere stark gekoppelte Modellkomponenten orchestriert werden, die jeweils unterschiedliche Rechenmuster und Performance-Anforderungen aufweisen. Gleichzeitig bieten moderne High-Performance-Computing-Systeme (HPC) zunehmend heterogene Architekturen, die diverse Recheneinheiten mit unterschiedlichen Speicherzugriffseigenschaften kombinieren. Dieser Vortrag beleuchtet, wie ICON effizient auf Architekturen der nächsten Generation wie JUPITER, Europas erstem Exascale-System, abgebildet werden kann, und präsentiert erste Ergebnisse, die sowohl die Machbarkeit globaler kilometergenauer Simulationen als auch einen beispiellosen Rechendurchsatz belegen.

Hendrik Nicolai, Jan Frederik Engels
Jülich Supercomputing Centre
 
16:00 – 16:30 UhrKaffeepause 
 
16:30 – 19:00 UhrTutorial zu verteiltem GPU-ComputingMathis Bode
Jülich Supercomputing Centre
 
7:00 – 7:30 UhrMorgendliches Training
 
8:00 – 9:00 UhrSchlaues Frühstück
 
9:00 – 12:00 UhrTutorial zu verteiltem GPU-Computing
 
12:00 – 13:00 UhrLunchpakete und Verabschiedung

Die Zukunft der Computerwissenschaft: HPC trifft auf KI

Der rasante Fortschritt im Bereich der KI erfordert zunehmend Rechenressourcen, die weit über die Leistungsfähigkeit herkömmlicher Workstations hinausgehen. High Performance Computing (HPC) bildet das Rückgrat moderner daten- und rechenintensiver Anwendungen. Die Kombination von HPC-Fachwissen mit KI-Methoden eröffnet völlig neue Möglichkeiten in Wissenschaft und Technik, insbesondere in den Bereichen: Fortgeschrittene Datenanalyse, physikalische Simulationen, stochastische Modellierung und Unsicherheitsquantifizierung sowie datengesteuerte Anwendungen.

Die Summer School vereint führendes HPC-Know-how mit innovativen Ansätzen in den Bereichen KI, Datenanalyse, physikalische Simulationen und stochastische Modellierung.

Lernen Sie von führenden HPC- und KI-Experten aus Europa und der ganzen Welt

Ein Konsortium bestehend aus der Technischen Universität München, dem ETH Zürich Campus Heilbronn, dem Jülich Supercomputing Centre, dem HLRS Stuttgart, dem Swiss National Computing Center (CSCS) und dem Leibniz-Rechenzentrum organisiert und veranstaltet die erste gemeinsame interdisziplinäre Sommerschule zu fortgeschrittenen Hochleistungsrechentechniken (HPC) für maschinelles Lernen, datengesteuerte Modelle und physikbasierte Simulationen.

In fünf Tagen mit intensiven Vorträgen, Workshops und Networking-Möglichkeiten erfahren die Teilnehmer, wie modernste HPC-Technologien die nächste Generation datengesteuerter Anwendungen ermöglichen – von skalierbaren KI-Modellen bis hin zu hochpräzisen Simulationen komplexer Systeme. Sie erhalten Einblicke in laufende Forschungsprojekte, wenden Methoden in praktischen Übungen an und knüpfen Kontakte zu führenden Forschern und dem regionalen Innovationsökosystem in Heilbronn – einem Zentrum für KI, Digitalisierung und Hochleistungsrechnen.

 

jetzt anmelden

 

  • Jens Domke (RIKEN, Japan)
  • Valentin Churavy (University of Augsburg, Germany)
  • Thorsten Kurth (Nvidia, Switzerland)
  • Fernanda Foertter (University of Alabama, USA)
  • Hatem Ltaief (KAUST, Saudi-Arabia)
  • Monica Dessole (CERN, Switzerland)
  • Marius Kurz (AMD, Germany)
  • Johannes Gebert (HLRS)
  • Mathis Bode (Jülich Supercomputing Centre)

Programm-Highlights

  • Auftakt-Networking-Event: Lernen Sie Trainer, Referenten und andere Teilnehmer in entspannter Atmosphäre kennen.
  • GPU-Programmierung & Exascale-Praktikum: Intensivkurs mit direktem Zugang zum JUPITER-Supercomputer.
  • Smart Breakfast Sessions: Kurze, interaktive Präsentationen zu Forschungsthemen und Produktivität im HPC-Umfeld.
  • Konferenztag: Internationale Gastredner präsentieren aktuelle Themen aus den Bereichen HPC, KI und deren Konvergenz.
  • Öffentlicher Abendvortrag: Spannende Einblicke in gesellschaftlich relevante Anwendungen von HPC und KI.
  • Fokussierte Fachmodule: Containerisierung, KI im großen Maßstab, Zukunftstechnologien, Physiksimulationen und HPC-Visualisierung.
  • Fortgeschrittene Kenntnisse in HPC und KI: Lernen Sie fortgeschrittene Themen wie Performance Engineering, Containerisierung, skalierbare KI und HPC-gestützte Visualisierung kennen.
  • Networking & Community: Knüpfen Sie wertvolle Kontakte zu Gleichgesinnten, Experten und führenden HPC-Zentren.
  • Lernen Sie von Top-Experten: Internationale Referenten von der TUM, dem ETH Zürich Campus Heilbronn, dem JSC, dem HLRS, dem CSCS und dem LRZ.
  • Praxisorientierte Projektarbeit: Bringen Sie Ihre eigenen Forschungsfragen ein und arbeiten Sie direkt mit Fachexperten daran.
  • Masterstudierende im fortgeschrittenen Studium, Doktoranden und Nachwuchswissenschaftler (Postdocs).
  • Studierende aus aller Welt, die ihre Fachkenntnisse im Bereich Mainframe-Computing vertiefen möchten.
  • Teilnehmer, die bereits über Erfahrung mit HPC und KI verfügen.

Termin: 16. bis 20. Juni 2026 

Veranstaltungsort: TUM-Campus Heilbronn, Deutschland 

Anmeldeschluss: 29. Mai 2026 

Sprache: Das Programm wird vollständig in englischer Sprache abgehalten. 

Voraussetzungen: Wir erwarten von den Teilnehmern grundlegende Kenntnisse in den Bereichen maschinelles Lernen und Statistik sowie Erfahrung im Umgang mit HPC-Systemen. Kenntnisse des UNIX/Linux-Betriebssystems und grundlegender Programmierwerkzeuge (wie Terminals, Editoren, Compiler und Python) sind von großem Vorteil. 

Zertifikat: Alle Teilnehmer erhalten nach erfolgreichem Abschluss ein von der TUM ausgestelltes Zertifikat. 

Teilnahmegebühr: Für die Teilnahme an der Summer School wird keine Teilnahmegebühr erhoben. Das Programm umfasst das fachliche und soziale Rahmenprogramm sowie die Betreuung durch die Organisatoren. Unterkunft sowie An- und Abreise sind nicht inkludiert und sind von den Teilnehmenden selbst zu organisieren und zu finanzieren.

Schwerpunkt: Fortgeschrittene Hochleistungsrechentechniken (HPC) für Maschinen.
 

jetzt bewerben

Ansprechpartner für akademische Fragen

Porträt von Prof. Dr. Hartwig Anzt

Prof. Dr. Hartwig Anzt

Computational Mathematics

Kontakt

Natalia Pokhyliuk

Program Managerin

+49 (0)7131 26418-311

TUM Campus Heilbronn - Lara Weinert

Lara Weinert

Program Managerin

+49 (0)7131 26418-318