PUGET Raphaël
Direction de recherche : Patrick GALLINARI
Co-encadrement : BASKIOTIS Nicolas
Etude de la classification dans un très grand nombre de catégories
La croissance des données disponibles aujourd'hui génère de nouvelles problématiques pour lesquelles l'apprentissage statistique ne possède pas de réponses adaptées.
Ainsi le cadre classique de la classification qui consiste à affecter une ou plusieurs classes à une instance est étendu à des problèmes avec des milliers, voire des millions de classes différentes.
Avec ces problèmes viennent de nouveaux axes de recherches comme la réduction de la compléxité de classification qui est habituellement linéaire en fonction du nombre de classes du problème.
Plusieurs familles de solutions pour cette problématique ont émergé comme la construction d'une hiérarchie de classifieurs ou bien l'adaptation de méthodes ensemblistes de type ECOC.
Le travail présenté ici propose deux nouvelles méthodes pour répondre au problème de classification extrême.
Le premier travail consiste en une nouvelle mesure asymétrique pour le partitionnement et la hiérarchisation de classes dans le cadre d'une classification hiérarchique alors que le second axe explore l'élaboration d'un algorithme séquentiel actif d'agrégation des classifieurs les plus intéressants.
Soutenance : 04/07/2016
Membres du jury :
Massih-Reza Amini, Laboratoire d'Informatique de Grenoble [Rapporteur]
Marc Tommasi, INRIA Lille [Rapporteur]
Nicolas Baskiotis, Université Pierre et Marie Curie
Patrick Gallinari, Université Pierre et Marie Curie
Marie-Jeanne Lesot, Université Pierre et Marie Curie
Jérémie Mary, INRIA Lille
Publications 2014-2020
-
2020
- P. Cribier‑Delande, R. Puget, V. Guigue, L. Denoyer : “Time Series Prediction using Disentangled Latent Factors”, ESANN 2020 - 28th European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning, Bruges, Belgium (2020)
-
2016
- R. Puget : “Etude de la classification dans un très grand nombre de catégories”, soutenance de thèse, soutenance 04/07/2016, direction de recherche Gallinari, Patrick, co-encadrement : Baskiotis, Nicolas (2016)
-
2015
- R. Puget, N. Baskiotis : “Hierarchical Label Partitioning for Large Scale Classification”, IEEE International Conference on Data Science and Advanced Analytics, DSAA'2015, Paris, France (2015)
- R. Puget, N. Baskiotis, P. Gallinari : “Sequential Dynamic Classification for Large Scale Multiclass Problems”, Extreme Classification Workshop at ICML, Lille, France (2015)
-
2014
- R. Puget, N. Baskiotis, P. Gallinari : “Scalable Learnability Measure for Hierarchical Learning in Large Scale Multi-Class Classification”, WSDM Workshop Web-Scale Classification: Classifying Big Data from the Web, New York, United States (2014)