HENNEQUIN Arthur
Direction de recherche : Lionel LACASSAGNE
Co-encadrement : Vladimir GLIGOROV (LPNHE) Benjamen COUTURIER (CERN)
Optimisation de performance pour l'expérience LHCb
L'expérience LHCb, au CERN, prépare une mise à niveau majeure de son détecteur et le passage d'un système de déclenchement matériel à un système de déclenchement entièrement logiciel. Elle est désormais confrontée au défi de pouvoir traiter les événements entrants à une cadence de 30 millions d'événements par seconde. Pour faire face à ce flux de données massif, le logiciel doit être optimisé pour utiliser plus efficacement la puissance de traitement de la ferme de filtrage. Cette thèse porte sur le premier algorithme du logiciel High Level Trigger de LHCb : l'algorithme de reconstruction du Vertex Locator (VELO). Le VELO est le premier détecteur rencontré par les particules, entourant directement la région d'interaction. Son objectif est de trouver les trajectoires candidates initiales qui seront ensuite suivies à travers les autres couches du détecteur LHCb. Ces trajectoires doivent être estimées avec une résolution suffisamment bonne pour qu'elles puisse également être utilisées pour localiser l'emplacement des collisions. La première étape de cet algorithme consiste à préparer les données en regroupant les pixels des capteurs en hits ; ce processus est appelé analyse en composantes connexes (ACC). Cette thèse présente plusieurs nouveaux algorithmes d'ACC pour les architectures CPU et GPU. Le premier algorithme, HA4, a été développé au tout début de cette thèse et a amélioré l'état de l'art de l'étiquetage en composantes connexes sur GPU, tout en étant la première implémentation efficace d'analyse en composantes connexes sur les GPU. Le deuxième algorithme est un portage GPU de l'algorithme CPU FLSL SIMD, inspiré de l'algorithme LSL. FLSL sur GPU est amélioré par rapport à HA4 en réduisant les conflits d'accès mémoire qui sont particulièrement présents sur les nouvelles architectures contenant beaucoup de cœurs. Outre FLSL, deux autres optimisations visant à réduire d'avantage les conflits sont présentées et évaluées. Sur CPU, deux nouveaux algorithmes ont été réalisés pour cette thèse. Le premier est une modification de l'algorithme classique de Rosenfeld pour utiliser le SIMD. Le second est un nouvel algorithme, nommé SparseCCL, qui tire parti de la faible densité des images d'entrée. Un nouvel algorithme de reconstruction pour le détecteur VELO utilisant le SIMD est présenté, qui permet à LHCb de traiter les événements en temps réel et d'améliorer la qualité de la reconstruction. La bibliothèque SIMDWrapper, développée pour ce nouvel algorithme, fait désormais partie du logiciel de LHCb et est utilisée dans d'autres algorithmes.
Soutenance : 31/01/2022
Membres du jury :
François Irigoin (CRI, Mines ParisTech) [Rapporteur]
Denis Barthou (INRIA Bordeaux) [Rapporteur]
Lionel Lacassagne (LIP6, Sorbonne Université)
Stef Graillat (LIP6, Sorbonne Université)
Caroline Collange (INRIA Rennes)
Vladimir Gligorov (LPNHE, Sorbonne Université)
Publications 2018-2022
-
2022
- A. Hennequin : “Optimisation de performance pour l’expérience LHCb ”, soutenance de thèse, soutenance 31/01/2022, direction de recherche Lacassagne, Lionel, co-encadrement : Vladimir, GLIGOROV (LPNHE) Benjamen COUTURIER (CERN) (2022)
-
2021
- F. Lemaitre, A. Hennequin, L. Lacassagne : “Taming Voting Algorithms on Gpus for an Efficient Connected Component Analysis Algorithm”, ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Toronto, Canada, pp. 7903-7907, (IEEE) (2021)
- F. Lemaitre, A. Hennequin, L. Lacassagne : “Taming Voting Algorithms on GPUs for an Efficient Connected Component Analysis Algorithm”, GPU Technical Conference, San Jose, United States (2021)
- R. Aaij, D. Cámpora Pérez, T. Colombo, C. Fitzpatrick, V. Gligorov, A. Hennequin, N. Neufeld, N. Nolte, R. Schwemmer, D. Vom Bruch : “Evolution of the energy efficiency of LHCb’s real-time processing”, EPJ Web Conf., vol. 251, Online, France, pp. 04009 (2021)
-
2020
- F. Lemaitre, A. Hennequin, L. Lacassagne : “How to speed Connected Component Labeling up with SIMD RLE algorithms”, Workshop on Programming Models for SIMD/Vector Processing (WPMVP@PPoPP), San Diego, Californie, United States (2020)
- A. Hennequin, B. Couturier, V. Gligorov, S. Ponce, R. Quagliani, L. Lacassagne : “A fast and efficient SIMD track reconstruction algorithm for the LHCb Upgrade 1 VELO-PIX detector”, Journal of Instrumentation, vol. 15 (06), pp. p06018, (IOP Publishing) (2020)
-
2019
- A. Hennequin, L. Lacassagne, I. Masliah : “Étiquetage et analyse en composantes connexes sur GPUs”, COMPAS, Anglet, France (2019)
- A. Hennequin, L. Lacassagne : “A new Direct Connected Component Labeling and Analysis Algorithm for GPUs”, GPU Technology Conference (GTC), San Jose, United States (2019)
- A. Hennequin, I. Masliah, L. Lacassagne : “Designing efficient SIMD algorithms for direct Connected Component Labeling”, WPMVP'19 Proceedings of the 5th Workshop on Programming Models for SIMD/Vector Processing, Washington, United States, pp. 4:1-4:8, (ACM) (2019)
- A. Hennequin, B. Couturier, V. Gligorov, L. Lacassagne : “SparseCCL: Connected Components Labeling and Analysis for sparse images”, DASIP 2019 - The Conference on Design and Architectures for Signal and Image Processing, Montréal, Canada (2019)
-
2018
- A. Hennequin, L. Lacassagne, L. Cabaret, Q. Meunier : “A new Direct Connected Component Labeling and Analysis Algorithms for GPUs”, 2018 Conference on Design and Architectures for Signal and Image Processing (DASIP), Porto, Portugal (2018)
- A. Petreto, A. Hennequin, Th. Koehler, Th. Romera, Y. Fargeix, B. Gaillard, M. Bouyer, Q. Meunier, L. Lacassagne : “Energy and Execution Time Comparison of Optical Flow Algorithms on SIMD and GPU Architectures”, Conference on Design and Architectures for Signal and Image Processing (Dasip 2018), Porto, Portugal (2018)
- N. Rambaux, D. Galayko, G. Guignan, J. Vaubaillon, L. Lacassagne, Ph. Keckhut, A. Levasseur‑Regourd, A. Hauchecorne, M. Birlan, G. Augarde, S. Barnier, S. Ben Kemmoum, A. Bigot, P. Boisse, M. Capderou, A. Chu, F. Colas, F. DESHOURS, Y. Fargeix, A. Hennequin, Th. Koehler, M. Lumbroso, J.‑F. Mariscal, D. Portela‑Moreira, J. Raffard, J.‑L. Rault, Th. Romera, C. Tob, B. Zanda : “METEORIX: a cubesat mission dedicated to the detection of meteors”, COSPAR 2018, 42nd Assembly, Pasadena, United States (2018)
- A. Petreto, A. Hennequin, Th. Koehler, Th. Romera, Y. Fargeix, B. Gaillard, M. Bouyer, Q. Meunier, L. Lacassagne : “Comparaison de la consommation énergétique et du temps d’exécution d’un algorithme de traitement d’images optimisé sur des architectures SIMD et GPU”, Conférence d’informatique en Parallélisme, Architecture et Système (COMPAS 2018), Toulouse, France (2018)
- A. Petreto, A. Hennequin, Th. Koehler, Th. Romera, Y. Fargeix, B. Gaillard, M. Bouyer, Q. Meunier, L. Lacassagne : “Comparaison de la consommation énergétique et du temps d’exécution d’un algorithme de traitement d’images optimisé sur des architectures SIMD et GPU”, GdR SOC2, Paris, France (2018)