VELCIN Julien

PhD student at Sorbonne University
Team : ACASA
https://lip6.fr/Julien.Velcin

Supervision : Jean-Gabriel GANASCIA

Extraction automatique de stéréotypes à partir de données symboliques et lacunaires

Cette thèse porte sur la construction automatique de stéréotypes à partir d'informations lacunaires. Nous avons choisi comme application les articles de presse car ils présentent justement ce caractère lacunaire. Or, tant en analyse de données qu'en apprentissage artificiel, les valeurs manquantes sont généralement considérées comme des anomalies qui sont traitées avec des techniques spécifiques, comme les k-plus-proches voisins ou l'algorithme EM, avant d'appliquer des méthodes usuelles d'analyse. La formation automatique de stéréotypes à partir de données symboliques partiellement décrites fait appel à un algorithme original d'apprentissage non supervisé fondé sur la notion de subsomption par défaut et à des techniques d'optimisation par recherche locale. La validation s'effectue à la fois à partir de données artificielles dégradées et de données réelles tirées d'articles de presse. Un lien est ainsi établi entre les techniques d'IA et le domaine de l'analyse du contenu de la presse.

Defence : 11/30/2005

Jury members :

CHAUDRON Laurent (ONERA Toulouse) [Rapporteur]
CORNUEJOLS Antoine (UNIV. ORSAY) [Rapporteur]
DIDAY Edwin (UNIV DAUPHINE) [Examinateur]
DUBOIS Danièle (LAM UPMC) [Examinatrice]
PERROT Jean-François (LIP6 UPMC) [Examinateur]
CHATEAURAYNAUD Francis (EHESS) [Invité]
GANASCIA Jean-Gabriel (LIP6 UPMC) [Directeur de thèse]

Departure date : 10/01/2007

2004-2007 Publications