MAES Francis

doctorant à Sorbonne Université
Équipe : MALIRE
https://lip6.fr/Francis.Maes

Direction de recherche : Patrick GALLINARI

Apprentissage dans les Processus de Décision Markoviens pour la Prédiction Structurée. Applications à l'étiquetage de séquences, la transformation d'arbres et l'apprentissage dans les problèmes de recherche combinatoire

De nombreux problèmes d'apprentissage supervisé font intervenir des sorties complexes : séquences, arbres ou graphes. La prédiction de sorties structurées pose d'importants défis, liés à la nature combinatoire du problème. Récemment, la prédiction structurée incrémentale, une approche générale et de faible complexité, a été proposée pour attaquer ces problèmes sous l’angle de la prise de décisions séquentielles. Dans cette thèse, je m'inscris dans cette approche et propose une nouvelle formulation basée sur le cadre des processus de décision Markoviens (PDMs). Cela permet d'utiliser des algorithmes d'apprentissage par renforcement pour résoudre les problèmes de prédiction structurée et de traiter des problèmes particulièrement complexes qu'aucun algorithme n'était en mesure de résoudre jusqu'alors. En plus de cette contribution majeure, je propose un nouvel algorithme d’apprentissage de politiques basé sur l'apprentissage d'une fonction d'ordonnancement d'actions. La validation est effectuée sur deux tâches: l'étiquetage de séquences et la transformation d'arbres. Les résultats obtenus sur les séquences sont compétitifs avec l'état de l'art et pour certains significativement meilleurs. La transformation d'arbres est un des problèmes d'apprentissage statistique les plus complexes abordés à ce jour et pour lequel il n'existait aucun modèle applicable. Je démontre l'efficacité de l'apprentissage par renforcement pour ce problème sur cinq jeux de données, dont deux à très large échelle. L'ensemble du code source développé au cours de cette thèse est testé, documenté et publié en code-ouvert dans le Journal of Machine Learning Research.

Soutenance : 15/10/2009

Membres du jury :

Rémi Gilleron, Professeur à l’université de Lille 3 [Rapporteur]
Louis Wehenkel, Professeur à l’université de Liège [Rapporteur]
Boris Chidlovskii, Centre de recherche Xerox Europe
Ludovic Denoyer, Maitre de conférence à l’université Pierre et Marie Curie (Paris 6)
Patrick Gallinari, Professeur à l’université Pierre et Marie Curie (Paris 6)
Olivier Sigaud, Professeur à l’université Pierre et Marie Curie (Paris 6)
Jean-Philippe Vert, Mines ParisTech et Institut Curie

Date de départ : 30/09/2010

Publications 2005-2012