Automated Partitioning of CUDA Kernels for Multi-GPU Systems
- Termin in der Vergangenheit
- Mittwoch, 4. September 2024, 13:00 Uhr
- INF 368, R.531
- Lorenz Braun
Adresse
INF 368
R.531Veranstalter
Dekan
Veranstaltungstyp
Disputation
Diese Arbeit zeigt die Machbarkeit der automatischen Partitionierung von CUDA-Kerneln für Multi-GPU-Systeme. Das Problem wird durch die Modellierung des Compute-Graphen ausgewählter Anwendungen angegangen. Mit Hilfe eines Simulators werden Modelle zur Vorhersage einer leistungsfähigen Partitionierung abgeleitet. Das Problem der akkuraten Vorhersage der GPU-Kernel-Laufzeit wird durch eine neue compilerunterstützte Methode zum Profiling von GPU-Kerneln angegangen. Die GPU unabhängigen Metriken des Profilers werden verwendet, um eine Methodik zur Vorhersage der Kernel-Laufzeit und des Energieverbrauchs zu entwickeln. Mit dieser Methodik werden vier GPU-Benchmark-Suites verwendet, um die Laufzeit und den Energieverbrauch von GPU-Kernel auf fünf verschiedenen GPUs zu modellieren.