How to connect the dots very fast? High-Performance Heterogeneous Particle Track Reconstruction for the ATLAS Phase-II High Level Trigger
- Mittwoch, 17. Dezember 2025, 13:00 - 15:00 Uhr
- INF 368, R.531
- Aleksandra Poreba
Adresse
Im Neuenheimer Feld 368
69120 Heidelberg
Raum 531Veranstaltungstyp
Disputation
Das ATLAS Experiment ist ein Schlüsselprojekt der Hochenergie-Teilchenphysik, das Teilchenkollisionen bei bislang unerreichten Energien untersucht, um Bedingungen des frühen Universums nachzubilden und Phänomene zu erforschen, die bei extremen Skalen auftreten. Das bevorstehende Hochluminositätsupgrade des LHC wird die Kollisionsrate und -energie signifikant erhöhen. Das dadurch entstehende größere Datenvolumen und die erhöhte Komplexität der Kollisionen erfordern eine umfassende Verbesserung des ATLAS-Detektors, insbesondere durch ein hochgranulares Spurdetektorsystem. Aufgrund der stark gesteigerten Datenrate und Verarbeitungskomplexität ist die Optimierung des Triggersystems und dessen rechenintensivsten Bestandteilen – den Spurrekonstruktionsalgorithmen – von zentraler Bedeutung. Die vorgestellte Arbeit untersucht anspruchsvolle Optimierungsmethoden, darunter die Beschleunigung durch Grafikkarten sowie den Einsatz von maschinellen Lernens, um die Recheneffizienz zu steigern und den erhöhten Datendurchsatz sowie die gesteigerte Komplexität des verbesserten Detektors effektiv zu bewältigen.
Der erste betrachtete Ansatz optimiert den im ATLAS-Triggersystem verwendeten Spurrekonstruktionsalgorithmus. Durch die Implementierung des Track Seedings auf einem GPU Beschleuniger und die Anpassung der Auswahlkriterien des Track Seedings konnte die Leistung um 95% verbessert werden, bei einer durchschnittlichen Verarbeitungszeit von 1.16 s pro Ereignis. Die Leistung wurde auf verschiedenen GPUs evaluiert, wobei deren Einschränkungen berücksichtigt wurden; die NVIDIA RTX 5000 Ada erzielte aufgrund ihrer außergewöhnlich hohen Anzahl an Verarbeitungskernen die besten Ergebnisse.
Der zweite Teil dieser Arbeit befasst sich mit dem Einsatz von Techniken des maschinellen Lernens zur Teilchenspurrekonstruktion. Ein neuartiges Interaction Graph Neural Network (IGNN) zeigt eine konkurrenzfähige Rekonstruktionsgenauigkeit, ist jedoch sehr ressourcenintensiv. Zur Bewältigung dieser rechentechnischen Herausforderungen werden zwei Optimierungsstrategien vorgeschlagen, die sowohl den Speicherbedarf als auch die Inferenzzeit reduzieren, ohne die Modellleistung zu beeinträchtigen.
Der momentane Speicherbedarf des Modells wurde durch partielle Verarbeitung (Substepping) verringert. Dadurch kann der Speicherverbrauch um etwa 30% gesenkt werden, ohne die Verarbeitungszeit zu erhöhen. Weitere Reduktionen sind durch Anpassung der Partitionsgröße möglich, was den Einsatz des IGNN auf speicherbeschränkten GPUs ermöglicht und – abhängig von den verfügbaren Hardwareressourcen – parallele Verarbeitung erlaubt.
Die zweite untersuchte Kompressionstechnik ist das strukturierte Pruning des IGNN, bei dem durch Entfernen der am wenigsten signifikanten Parametergruppen die Modellgröße reduziert wird. Eine Auswahl an Pruning-Methoden für Graph Neural Networks (GNNs) wurde analysiert, um die effektivste Methode zur GNN-Kompression zu ermitteln. Die finale Pruning-Konfiguration erreicht eine Leistungssteigerung von bis zu 20% bei unveränderter Modellgenauigkeit. Darüber hinaus wurde die schichtweise Sensitivität analysiert und in die Pruning-Strategie integriert, um die Aggressivität des Prunings pro Schicht zu steuern. Dies ermöglichte eine zusätzliche Reduktion der Modellgröße um 20% bei gleichbleibender Rekonstruktionsgenauigkeit. Die Pruning-Strategie wurde anhand standardisierter GNN Benchmarks evaluiert und zeigte signifikant Leistungsgewinne. Die Leistung des IGNN wurde auf verschiedenen Grafikkarten untersucht; die NVIDIA RTX A100 erzielte aufgrund ihres hoch effizienten Speicherdurchsatzes die besten Ergebnisse.