WISNIEWSKI Guillaume

doctorant à Sorbonne Université
Équipe : MALIRE
https://perso.lip6.fr/Guillaume.Wisniewski

Direction de recherche : Patrick GALLINARI

Apprentissage dans les espaces structurés. Application à l'étiquetage de séquences et à la transformation automatique de documents

De nombreux problèmes d'apprentissage consiste à prédire des séquences, des arbres ou des graphes. Contrairement aux problèmes de classification usuels, ces sorties sont structurées et se décomposent en un ensemble d'éléments étiquetés interdépendants. L'apprentissage structuré est domaine de l'apprentissage statistique proposé récément pour développer des méthodes d'apprentissage capables de découvrir et d'exploiter ces dépendances entre étiquettes pour améliorer les performances en prédiction. L'étude des différents cadres et méthodes d'apprentissage structuré constitue la première partie de cette thèse. Nous y décrivons notamment l'application de ces méthodes sur une tâche d'étiquetage de séquences et sur une tâche de prédiction d'arbres. Cette dernière tâche est directement motivée par la problématique générale d'automatisation de la transformation de documents structurés qui est, aujourd'hui, au coeur de plusieurs problématiques d'accès à l'information. Dans une deuxième partie de ce travail, nous nous sommes intéressé à deux limites des modèles existants qui rendent ceux-ci inapplicables à de nombreux problèmes pratiques~: leur complexité élevée et leur expressivité limitée qui ne leur permet de ne considérer que des dépendances locales. Nous proposons d'aborder ce problème sous l'angle de la sélection de caractéristiques et décrivons une méthode d'étiquetage de séquences représentant les dépendances par des contraintes, ce qui lui permet d'extraire efficacement les dépendances non locales et de les utiliser en inférence tout en conservant une complexité faible.

Soutenance : 29/11/2007

Membres du jury :

Younès Bennani Professeur à l'Université de Paris Nord (Paris 13)
Patrick Gallinari Professeur à l'Université Pierre et Marie Curie (Paris 6)
Éric Gaussier Professeur à l'Université Joseph Fourrier (Grenoble 1)
Marc Sebban Professeur à l'Université Jean-Monnet, Saint-Étienne
Marc Tommasi Maître de Conférences, HDR à l'Université de Lille 3 [Rapporteur]
François Yvon Professeur à l'Université Paris Sud (Paris 11) [Rapporteur]

Date de départ : 31/08/2008

Publications 2004-2007