FRADET Nathan
Direction de recherche : Amal EL FALLAH SEGHROUCHNI
Co-encadrement : BRIOT Jean-Pierre
Apprentissage automatique pour la modélisation de musique symbolique
La modélisation de la musique symbolique représente les tâches effectuées par les modèles d’apprentissage automatique avec la musicale symbolique, parmi lesquelles figurent notamment la génération de musique ou la récupération d'informations musicales. Ces tâches sont couramment effectuées par des modèles séquentiels qui traitent les données sous forme de séquences d'éléments discrets appelés tokens. Nous étudions dans cette thèse comment la musique symbolique peut être sérialisée, et quels sont les impacts des différentes méthodes sur les performances et l'efficacité des modèles. Les défis actuels incluent le manque de logiciel pour effectuer cette étape, la faible efficacité des modèles et les tokens inexpressifs. Nous relevons ces défis en :
- développant une bibliothèque logicielle complète, flexible et facile à utiliser permettant de tokeniser la musique symbolique ;
- analysant l'impact de diverses stratégies de tokenisation sur les performances des modèles ;
- augmentant les performances et l'efficacité des modèles en exploitant de vastes vocabulaires musicaux grâce à l'utilisation de « Byte Pair Encoding » ;
- créant l'un des premiers modèles à grande échelle de génération de musique symbolique.
Soutenance : 14/03/2024
Membres du jury :
Jean-Pierre Briot - LIP6, Sorbonne Université/CNRS
Amal El Fallah Seghrouchni - LIP6, Sorbonne Université/CNRS
Nicolas Gutowski - LERIA, Université d'Angers
Fabien Chhel - ESEO, ERIS
Louis Bigo - LaBRI, Université de Bordeaux/CNRS
Philippe Pasquier - Simon Fraser University
François Pachet - Spotify
Gaëtan Hadjeres - Sony AI
Publications 2021-2024
-
2024
- N. Fradet : “Deep Learning for Symbolic Music Modeling”, soutenance de thèse, soutenance 14/03/2024, direction de recherche El fallah seghrouchni, Amal, co-encadrement : Briot, Jean-Pierre (2024)
-
2023
- N. Fradet, N. Gutowski, F. Chhel, J.‑P. Briot : “Byte Pair Encoding for Symbolic Music”, Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, Singapore, Singapore, pp. 2001-2020, (Association for Computational Linguistics) (2023)
- N. Fradet, N. Gutowski, F. Chhel, J.‑P. Briot : “Impact of time and note duration tokenizations on deep learning symbolic music modeling”, Proceedings of the 24th Conference of the International Society for Music Information Retrieval (ISMIR) 2023, Milano, Italy, pp. 89-97, (ISMIR), (ISBN: 978-1-7327299-3-3) (2023)
-
2021
- N. Fradet, J.‑P. Briot, F. Chhel, A. El Fallah‑Seghrouchni, N. Gutowski : “MidiTok: A Python Package for MIDI File Tokenization”, Extended Abstracts for the Late-Breaking Demo Session of the 22nd International Society for Music Information Retrieval Conference, Online, United States (2021)