DULAC-ARNOLD Gabriel
Direction de recherche : Patrick GALLINARI
Co-encadrement : DENOYER Ludovic
Modèles Sequentiels pour la Classification Multiclasse, Sparse et Budgetée
Cette thèse s’intéresse au développement de modèles séquentiels d’apprentissage pour la classification, qui sont des modèles permettant de traiter des tâches pour lesquelles le processus de décision ne peut être modélisé par un processus atomique. C’est par exemple le cas quand l’information à traiter n’est pas immédiatement disponible, ou quand l’objet à classifier est composé d’information dont l’accès est plus ou moins simple en terme de temps, de puissance de calcul, ou même de prix. Le but de notre travail est d’introduire une nouvelle méthode appelé ‘classification datum-wise’, qui permet le traitement de ces tâches de classification complexes en modélisant l’acquisition d’information et la décision par un processus séquentiel. Nous commençons ce manuscrit par un survol des méthodes classiques d’apprentissage supervisé et des méthodes d’apprentissage par renforcement qui sont au coeur de ces travaux. Puis, à partir des notions introduites, nous présentons les classifieurs dits ‘datum-wise’, qui sont des classifieurs modélisés par une politique dans un proces- sus séquentiel apprise à travers des algorithmes d’apprentissage par renforcement. Nous montrons la capacité de cette méthode à résoudre deux problèmes classiques : la classification textuelle et la classification d’image, et montrons les avantages de notre méthode en comparaison des approches classiques. Dans la suite de notre thèse, nous montrons que, par la modification de la fonc- tion récompense et de la structure du processus de décision, nous pouvons ajouter au système des contraintes en terme de parcimonie ou bien de prix par exemple, et proposons donc une famille de modèles plus généraux pour la classification sous con- trainte. Le modèle proposé permet ainsi de résoudre des problèmes où l’acquisition de caractéristiques a un coût, ou bien encore quand le système dispose d’un budget fixé ou limité. Cette résolution se fait au prix d’une augmentation significative de la complexité d’apprentissage. Ce dernier aspect est traité par la proposition et l’évaluation de deux nouveaux algorithmes d’apprentissage par renforcement per- mettant l’apprentissage de politique sous-optimales, mais avec une complexité très faible par rapport aux méthodes du domaine.
Soutenance : 07/02/2014
Membres du jury :
Stéphane Canu, INSA de Rouen [Rapporteur]
Balázs Kégl, Laboratoire Accélerateur Linéarie, Paris Sud [Rapporteur]
Ludovic Denoyer, LIP6-UPMC
Stéphane Doncieux, ISIR-UPMC
Damien Ernst, Université de Liège
Patrick Gallinari, LIP6-UPMC
Philippe Preux, INRIA Nord / LIFL
Bruno Scherrer, INRIA Nancy
Publications 2011-2014
-
2014
- G. Dulac‑Arnold : “A General Sequential Model for Constrained Classification”, soutenance de thèse, soutenance 07/02/2014, direction de recherche Gallinari, Patrick, co-encadrement : Denoyer, Ludovic (2014)
- G. Dulac‑Arnold, L. Denoyer, N. Thome, M. Cord, P. Gallinari : “Sequentially Generated Instance-Dependent Image Representations for Classification”, International Conference on Learning Representations, ICLR 2014, Banff, Canada (2014)
-
2012
- G. Dulac‑Arnold, L. Denoyer, Ph. Preux, P. Gallinari : “Sequential approaches for learning datum-wise sparse representations”, Machine Learning, vol. 89 (1-2), pp. 87-122, (Springer Verlag) (2012)
- G. Dulac‑Arnold, L. Denoyer, P. Gallinari : “Lecture Séquentielle de Documents pour la Classification”, CORIA, Bordeaux, France, pp. 245-259 (2012)
- G. Dulac‑Arnold, L. Denoyer, Ph. Preux, P. Gallinari : “Fast Reinforcement Learning with Large Action Sets Using Error-Correcting Output Codes for MDP Factorization”, Machine Learning and Knowledge Discovery in Databases, vol. 7524, Lecture Notes in Computer Science, Bristol, United Kingdom, pp. 180-194, (Springer) (2012)
- G. Dulac‑Arnold, L. Denoyer, Ph. Preux, P. Gallinari : “Classification Localement Parcimonieuse par Méthodes Séquentielles”, CAP 2012 - Conférence Francophone sur l'Apprentissage Automatique, Nancy, France (2012)
- G. Dulac‑Arnold, L. Denoyer, Ph. Preux, P. Gallinari : “Apprentissage par renforcement rapide pour des grands ensembles d’actions en utilisant des codes correcteurs d’erreur”, Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, Villers-lès-Nancy, France, pp. 12 p (2012)
-
2011
- G. Dulac‑Arnold, L. Denoyer, Ph. Preux, P. Gallinari : “Datum-wise classification. A sequential Approach to sparsity”, ECML PKDD 2011 - European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases, vol. 6911, Lecture Notes in Computer Science, Athens, Greece, pp. 375-390, (Springer) (2011)
- G. Dulac‑Arnold, L. Denoyer, P. Gallinari : “Text Classification: A Sequential Reading Approach”, 33rd European Conference on Information Retrieval (ECIR 2011), vol. 6611, Lecture Notes in Computer Science, Dublin, Ireland, pp. 411-423, (Springer Berlin / Heidelberg) (2011)