VELCIN Julien
Supervision : Jean-Gabriel GANASCIA
Extraction automatique de stéréotypes à partir de données symboliques et lacunaires
Cette thèse porte sur la construction automatique de stéréotypes à partir d'informations lacunaires. Nous avons choisi comme application les articles de presse car ils présentent justement ce caractère lacunaire. Or, tant en analyse de données qu'en apprentissage artificiel, les valeurs manquantes sont généralement considérées comme des anomalies qui sont traitées avec des techniques spécifiques, comme les k-plus-proches voisins ou l'algorithme EM, avant d'appliquer des méthodes usuelles d'analyse. La formation automatique de stéréotypes à partir de données symboliques partiellement décrites fait appel à un algorithme original d'apprentissage non supervisé fondé sur la notion de subsomption par défaut et à des techniques d'optimisation par recherche locale. La validation s'effectue à la fois à partir de données artificielles dégradées et de données réelles tirées d'articles de presse. Un lien est ainsi établi entre les techniques d'IA et le domaine de l'analyse du contenu de la presse.
Defence : 11/30/2005
Jury members :
CHAUDRON Laurent (ONERA Toulouse) [Rapporteur]
CORNUEJOLS Antoine (UNIV. ORSAY) [Rapporteur]
DIDAY Edwin (UNIV DAUPHINE) [Examinateur]
DUBOIS Danièle (LAM UPMC) [Examinatrice]
PERROT Jean-François (LIP6 UPMC) [Examinateur]
CHATEAURAYNAUD Francis (EHESS) [Invité]
GANASCIA Jean-Gabriel (LIP6 UPMC) [Directeur de thèse]
2004-2007 Publications
-
2007
- J. Velcin, J.‑G. Ganascia : “Topic Extraction with AGAPE”, Proceedings of the International Conference on Advanced Data Mining and Applications (ADMA), vol. 4632, Lecture Notes in Computer Science, Harbin, China, pp. 377-388, (Springer) (2007)
- J. Velcin, J.‑G. Ganascia : “A Tabu-based Approach for Topic Extraction”, The series Posterproceedings Machine Learning and Data Mining in Pattern Recognition (MLDM 2007), Leipzig, Germany, pp. 41-54 (2007)
- J. Velcin, W. Vacher, J.‑G. Ganascia : “Logiciel d’Aide Ă l’Evaluation des CatĂ©gorisations”, Revue des Nouvelles Technologies de l'Information (CĂ©paduès) : Actes de la ConfĂ©rence Extraction et Gestion des Connaissances (EGC 2007), vol. RNTI-E-9, Revue des Nouvelles Technologies de l'Information, Namur, Belgium, pp. 175-176, (CĂ©paduès) (2007)
- J. Velcin, J.‑G. Ganascia : “Default Clustering with Conceptual Structures”, Journal on Data Semantics, vol. VIII, pp. 1-25, (Springer) (2007)
- J.‑G. Ganascia, J. Velcin : “Unsupervised Learning Informational Limit in case of Sparsely Described Examples”, chapter in Selected Contributions in Classification and Data Analysis, pp. 345-355, (Springer), (ISBN: 978-3-540-73558-8) (2007)
-
2006
- J. Velcin : “Classification par dĂ©faut Ă base de stĂ©rĂ©otypes”, ConfĂ©rence francophone sur l'APprentissage automatique (CAp), TrĂ©gastel, France (2006)
- J.‑G. Ganascia, J. Velcin : “Automatic Stereotype Extraction”, International Conference on Cognitive Modeling (ICCM), Trieste, Italy, pp. 112-117 (2006)
-
2005
- J. Velcin : “Extraction automatique de stĂ©rĂ©otypes Ă partir de donnĂ©es symboliques et lacunaires”, thesis, phd defence 11/30/2005, supervision Ganascia, Jean-Gabriel (2005)
- J. Velcin, J.‑G. Ganascia : “Default Clustering from Sparse Data Sets”, ECSQARU 2005 - 8th European Conference on Symbolic and Quantitative Approaches to Reasoning with Uncertainty, vol. 3571, Lecture Notes in Computer Science, Barcelona, Spain, pp. 968-979, (Springer) (2005)
- J. Velcin, J.‑G. Ganascia : “Stereotype Extraction with Default Clustering”, IJCAI 2005 - 19th International Joint Conference on Artificial Intelligence, Edinburgh, Scotland, United Kingdom, pp. 883-888 (2005)
-
2004
- J. Velcin, J.‑G. Ganascia : “Reconstruction automatique de stĂ©rĂ©otypes Ă partir de donnĂ©es lacunaires”, Colloque Arco'04, Compiègne, France (2004)
- J. Velcin, J.‑G. Ganascia : “Modeling default induction with conceptual structures”, International Conference on Conceptual Modeling (ER), vol. 3288, Lecture Notes in Computer Science, Shangai, China, pp. 83-95, (Springer-Verlag) (2004)
- J.‑G. Ganascia, J. Velcin : “Clustering of Conceptual Graphs with Sparse Data”, 12th International Conference on Conceptual Structures (ICCS), vol. 3127, Lecture Notes in Computer Science, Huntsville, United States, pp. 156-169, (Springer-verlag) (2004)