Automated Partitioning of CUDA Kernels for Multi-GPU Systems

  • Termin in der Vergangenheit
  • Mittwoch, 4. September 2024, 13:00 Uhr
  • INF 368, R.531
    • Lorenz Braun
  • Adresse

    INF 368
    R.531

  • Veranstalter

  • Veranstaltungstyp

Diese Arbeit zeigt die Machbarkeit der automatischen Partitionierung von CUDA-Kerneln für Multi-GPU-Systeme. Das Problem wird durch die Modellierung des Compute-Graphen ausgewählter Anwendungen angegangen. Mit Hilfe eines Simulators werden Modelle zur Vorhersage einer leistungsfähigen Partitionierung abgeleitet. Das Problem der akkuraten Vorhersage der GPU-Kernel-Laufzeit wird durch eine neue compilerunterstützte Methode zum Profiling von GPU-Kerneln angegangen. Die GPU unabhängigen Metriken des Profilers werden verwendet, um eine Methodik zur Vorhersage der Kernel-Laufzeit und des Energieverbrauchs zu entwickeln. Mit dieser Methodik werden vier GPU-Benchmark-Suites verwendet, um die Laufzeit und den Energieverbrauch von GPU-Kernel auf fünf verschiedenen GPUs zu modellieren.