PONT Mathieu

doctorant à Sorbonne Université
Équipe : APR
https://perso.lip6.fr/Mathieu.Pont

Direction de recherche : Julien TIERNY

Analyse d'Ensembles de Descripteurs Topologiques

L’analyse topologique de données forme un ensemble d’outils visant à révéler de manière générique, robuste et efficace les caractéristiques structurelles implicites cachées dans des ensembles de données complexes. Ces outils permettent de calculer une représentation topologique pour chaque membre d’un ensemble de données en encodant ses principales caractéristiques d’intérêt de manière concise et informative. Un défi majeur consiste alors à concevoir des outils d’analyse pour de tels ensembles de descripteurs topologiques. Plusieurs outils ont été bien étudiés pour les diagrammes de persistance, l’un des descripteurs les plus utilisés.
Cependant, ils souffrent d’un manque de spécificité, pouvant donner des représentations de données identiques pour des données significativement différentes. Dans cette thèse, nous avons cherché à développer des outils d’analyse plus avancés pour des ensembles de descripteurs topologiques, capables de résoudre le problème de discriminabilité des diagrammes de persistance et d’aller au-delà de ce qui était déjà disponible pour ces objets.
Tout d’abord nous adaptons aux arbres de fusion, descripteurs ayant une meilleure spécificité, les outils déjà disponibles pour les diagrammes de persistance tels que le calcul de distances, géodésiques et barycentres. Ensuite, nous souhaitons aller au-delà de cette simple notion de moyenne qu’est le barycentre pour étudier la variabilité au sein d’un ensemble de descripteurs topologiques. Nous adaptons alors le cadre de l’Analyse en Composantes Principales aux diagrammes de persistance et les arbres de fusion, résultant en une méthode de réduction de dimensions qui indique quelles structures dans l’ensemble sont les plus responsables de la variabilité. Cependant, ce cadre permet uniquement de détecter des tendances linéaires de variabilité dans l’ensemble.
Pour résoudre ce problème, nous proposons de généraliser ce cadre aux Auto-Encodeurs afin de détecter des motifs non linéaires, c.-à-d. plus complexes, dans un ensemble d’arbres de fusions ou de diagrammes de persistance. Plus précisément, nous proposons une nouvelle couche de réseau de neurones capable de traiter nativement ces objets.
Nous présentons des applications de ces travaux pour le suivi de structures dans un ensemble de données variant dans le temps, pour la réduction de données pour compresser un ensemble de descripteurs topologiques, dans le partitionnement pour former des groupes homogènes dans un ensemble, et dans la réduction de dimensions pour créer une carte visuelle indiquant comment les données sont organisées les unes par rapport aux autres dans l’ensemble.

Soutenance : 01/12/2023

Membres du jury :

David Coeurjolly, CNRS [Rapporteur]
Vijay Natarajan, Indian Institut of Science Bengalore [Rapporteur]
Elsa Cazelles, CNRS
Stanley Durrleman, INRIA
Roland Kwitt, University of Salzburg
Gabriel Peyré, CNRS
Katharine Turner, Australian National University
Julien Tierny, CNRS

Date de départ : 30/09/2024

Publications 2021-2024