Automated Partitioning of CUDA Kernels for Multi-GPU Systems

Termin in der Vergangenheit
Mittwoch, 4. September 2024, 13:00 Uhr
INF 368, R.531
- Lorenz Braun

Adresse
INF 368
R.531
Veranstalter
Dekan
Veranstaltungstyp
Disputation

Diese Arbeit zeigt die Machbarkeit der automatischen Partitionierung von CUDA-Kerneln für Multi-GPU-Systeme. Das Problem wird durch die Modellierung des Compute-Graphen ausgewählter Anwendungen angegangen. Mit Hilfe eines Simulators werden Modelle zur Vorhersage einer leistungsfähigen Partitionierung abgeleitet. Das Problem der akkuraten Vorhersage der GPU-Kernel-Laufzeit wird durch eine neue compilerunterstützte Methode zum Profiling von GPU-Kerneln angegangen. Die GPU unabhängigen Metriken des Profilers werden verwendet, um eine Methodik zur Vorhersage der Kernel-Laufzeit und des Energieverbrauchs zu entwickeln. Mit dieser Methodik werden vier GPU-Benchmark-Suites verwendet, um die Laufzeit und den Energieverbrauch von GPU-Kernel auf fünf verschiedenen GPUs zu modellieren.

English

Automated Partitioning of CUDA Kernels for Multi-GPU Systems

Adresse

Veranstalter

Veranstaltungstyp

Für Studierende

Für Mitarbeiter*innen

Für Besucher*innen