LEMAITRE Florian
Direction de recherche : Lionel LACASSAGNE
Co-encadrement : Benjamen Couturier (CERN)
Optimisation et transformations d'algorithmes pour l'expérience LHCb
Tout au long de cette thèse, nous avons étudié des problèmes d'algèbre linéaire de petite dimension (typiquement de 2x2 à 5x5) utilisés au sein de l'expérience LHCb (mais aussi dans d'autres domaines tels que la vision par ordinateur). Les bibliothèques d’algèbre linéaire telles que Eigen, Magma ou la MKL ne sont pas optimisées pour de petites matrices.
Nous avons utilisé et combiné plusieurs transformations connues facilitant le SIMD ainsi que des transformations moins usuelles comme la racine carré inverse rapide. Pour faciliter l’écriture de ces transformations, mais également dans le but d’avoir un code portable, nous avons écrit un générateur de code.
Nous avons testé ces transformations et analysé leur impact sur la vitesse de traitement d’algorithmes simples. Le traitement par lot (batch) en SoA est crucial pour maximiser la vitesse de traitements de ces problèmes à faible dimension. Une analyse de la précision des résultats en fonction de la précision de calcul a également été faite sur ces exemples.
Nous avons alors implémenté ces transformations dans le but d’accélérer la factorisation de Cholesky de petites matrices (jusqu'à 12x12). La vitesse de traitement plafonne sans l’utilisation du calcul rapide de la racine carrée inverse. Nous avons obtenu une accélération entre x10 et x33 en F32.
Enfin, nous avons étudié et accéléré le filtre de Kalman généraliste. Nous avons ainsi obtenu une accélération de x90 sur l'implémentation 4x4 F32. Le filtre de Kalman utilisé au sein de LHCb a été accéléré d'un facteur x2,2 par rapport à la version actuelle SIMD et supérieur à x2,3 par rapport aux filtres d'autres expériences de physique des particules.
Soutenance : 13/02/2019
Membres du jury :
Albert COHEN Google [Rapporteur]
Daniel MENARD IETR (Université de Rennes) [Rapporteur]
Lionel LACASSAGNE LIP6 (Sorbonne Université)
Emmanuel CHAILLOUX LIP6 (Sorbonne Université)
Michèle GOUIFFÈS LIMSI (Université Paris-Sud)
Bertrand LE GAL IMS (Université de Bordeaux)
Publications 2016-2023
-
2023
- Th. Romera, A. Petreto, F. Lemaitre, M. Bouyer, Quentin L. Meunier, L. Lacassagne, D. Etiemble : “Optical flow algorithms optimized for speed, energy and accuracy on embedded GPUs”, Journal of Real-Time Image Processing, vol. 20 (2), pp. 32, (Springer Verlag) (2023)
-
2022
- N. Maurice, F. Lemaitre, J. Sopena, L. Lacassagne : “LSL3D : Etiquetage en Composantes Connexe par segments pour volumes 3D”, COMPAS 2022 - Conférence francophone d'informatique en Parallélisme, Architecture et Système, Amiens, France (2022)
- F. Lemaitre, N. Maurice, L. Lacassagne : “An efficient run-based Connected Component Labeling algorithm for processing holes”, Binary is the new Black and White workshop @ IEEE ICIAP 2022, Lecce, Italy (2022)
- N. Maurice, F. Lemaitre, J. Sopena, L. Lacassagne : “LSL3D: a run-based Connected Component Labeling algorithm for 3D volumes”, Binary is the new Black and White workshop @ IEEE ICIAP 2022, Lecce, Italy (2022)
- N. Blin, E. Carlinet, F. Lemaitre, L. Lacassagne, Th. Géraud : “Max-tree Computation on GPUs”, (2022)
- M. Millet, N. Rambaux, A. Petreto, F. Lemaitre, L. Lacassagne : “Meteorix - A new processing chain for real-time detection and tracking of meteors from space”, WGN, Journal of the International Meteor Organization, vol. 49 (6), (International Meteor Organization) (2022)
-
2021
- M. Millet, N. Rambaux, A. Petreto, F. Lemaitre, L. Lacassagne : “Meteorix: a new processing chain for detection and tracking of meteors from space”, IMC 2021 - International Meteor Conference, conférence virtuelle, France (2021)
- M. Millet, N. Rambaux, A. Petreto, F. Lemaitre, L. Lacassagne : “Détection temps réel de météores à bord d’un nanosatellite, application au projet Meteorix”, ORASIS 2021, Saint Ferréol, France (2021)
- Th. Romera, A. Petreto, F. Lemaitre, M. Bouyer, Q. Meunier, L. Lacassagne : “Implementations Impact on Iterative Image Processing for Embedded GPU”, European Signal Processing Conference (EUSIPCO), Dublin, Ireland (2021)
- F. Lemaitre, A. Hennequin, L. Lacassagne : “Taming Voting Algorithms on Gpus for an Efficient Connected Component Analysis Algorithm”, ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Toronto, Canada, pp. 7903-7907, (IEEE) (2021)
- F. Lemaitre, A. Hennequin, L. Lacassagne : “Taming Voting Algorithms on GPUs for an Efficient Connected Component Analysis Algorithm”, GPU Technical Conference, San Jose, United States (2021)
- F. Lemaitre, L. Lacassagne : “A new run-based Connected Component Labeling for efficiently analyzing and processing holes”, (2021)
-
2020
- F. Lemaitre, A. Hennequin, L. Lacassagne : “How to speed Connected Component Labeling up with SIMD RLE algorithms”, Workshop on Programming Models for SIMD/Vector Processing (WPMVP@PPoPP), San Diego, Californie, United States (2020)
- A. Petreto, Th. Romera, F. Lemaitre, M. Bouyer, B. Gaillard, P. Menard, Q. Meunier, L. Lacassagne : “Real-time embedded video denoiser prototype”, 9th International Symposium - Optronics in Defense and Security (Optro), Paris, France (2020)
-
2019
- F. Lemaitre : “Optimisation et transformations d’algorithmes pour l’expérience LHCb”, soutenance de thèse, soutenance 13/02/2019, direction de recherche Lacassagne, Lionel, co-encadrement : Benjamen, Couturier (CERN) (2019)
- A. Petreto, Th. Romera, F. Lemaitre, I. Masliah, B. Gaillard, M. Bouyer, Q. Meunier, L. Lacassagne : “Débruitage temps réel embarqué pour vidéos fortement bruitées”, COMPAS 2019, Anglet, France (2019)
- A. Petreto, Th. Romera, I. Masliah, B. Gaillard, M. Bouyer, Q. Meunier, L. Lacassagne, F. Lemaitre : “A New Real-Time Embedded Video Denoising Algorithm”, DASIP 2019 - The Conference on Design and Architectures for Signal and Image Processing, Montréal, Canada (2019)
-
2018
- F. Lemaitre, B. Couturier, L. Lacassagne : “Small SIMD Matrices for CERN High Throughput Computing”, WPMVP 2018 Workshop on Programming Models for SIMD/Vector Processing, Vienna, Austria, (ACM Press) (2018)
-
2017
- F. Lemaitre, B. Couturier, L. Lacassagne : “Cholesky Factorization on SIMD multi-core architectures”, Journal of Systems Architecture, (Elsevier) (2017)
-
2016
- F. Lemaitre, L. Lacassagne : “Batched Cholesky Factorization for tiny matrices”, Design and Architectures for Signal and Image Processing (DASIP), Rennes, France, pp. 1-8 (2016)