VELCIN Julien

doctorant à Sorbonne Université
Équipe : ACASA
https://lip6.fr/Julien.Velcin

Direction de recherche : Jean-Gabriel GANASCIA

Extraction automatique de stéréotypes à partir de données symboliques et lacunaires

Cette thèse porte sur la construction automatique de stéréotypes à partir d'informations lacunaires. Nous avons choisi comme application les articles de presse car ils présentent justement ce caractère lacunaire. Or, tant en analyse de données qu'en apprentissage artificiel, les valeurs manquantes sont généralement considérées comme des anomalies qui sont traitées avec des techniques spécifiques, comme les k-plus-proches voisins ou l'algorithme EM, avant d'appliquer des méthodes usuelles d'analyse. La formation automatique de stéréotypes à partir de données symboliques partiellement décrites fait appel à un algorithme original d'apprentissage non supervisé fondé sur la notion de subsomption par défaut et à des techniques d'optimisation par recherche locale. La validation s'effectue à la fois à partir de données artificielles dégradées et de données réelles tirées d'articles de presse. Un lien est ainsi établi entre les techniques d'IA et le domaine de l'analyse du contenu de la presse.

Soutenance : 30/11/2005

Membres du jury :

CHAUDRON Laurent (ONERA Toulouse) [Rapporteur]
CORNUEJOLS Antoine (UNIV. ORSAY) [Rapporteur]
DIDAY Edwin (UNIV DAUPHINE) [Examinateur]
DUBOIS Danièle (LAM UPMC) [Examinatrice]
PERROT Jean-François (LIP6 UPMC) [Examinateur]
CHATEAURAYNAUD Francis (EHESS) [Invité]
GANASCIA Jean-Gabriel (LIP6 UPMC) [Directeur de thèse]

Date de départ : 01/10/2007

Publications 2004-2007