CHANGUEL Sahar
Direction de recherche : Bernadette BOUCHON-MEUNIER
Co-encadrement : LABROCHE Nicolas
Métadonnées pour la personnalisation et l'accès à la connaissance
Au cours des dernières années, plusieurs institutions et projets se sont focalisés sur le développement d'entrepôts de ressources éducatives. Une des méthodes proposées pour améliorer la recherche sur ces entrepôts ou sur le web d'une manière générale consiste à enrichir les documents avec des métadonnées. C'est un ensemble d'informations destinées à mieux identifier ces ressources : l'auteur, la date de publication, le titre, etc. Ces métadonnées permettent de décrire, de localiser ou encore de faciliter la découverte et l'utilisation des ressources. Le besoin de méthodes de production des métadonnées qui sont plus efficaces et moins coûteuses que celles impliquant des êtres humains se fait sentir. Notre objectif dans ce travail de thèse est donc de réaliser des méthodes d'extraction automatique de métadonnées à partir des ressources éducatives afin de minimiser l'effort humain d'annotation.
Dans une première étude, nous explorons les relations qui peuvent exister entre les différents champs de métadonnées. Nous utilisons pour cela des méthodes d'apprentissage supervisé ainsi que des méthodes à base de règles d'association. Cette étude nous a permis de constater que certains champs de métadonnées peuvent contribuer à l'annotation d'autres champs. Cette approche est importante puisqu'elle est indépendante du type et de la représentation de la ressource.
Nous nous sommes aussi intéressés à l'extraction de métadonnées à partir du contenu des ressources. Les méthodes proposées se basent sur des techniques d'apprentissage statistique, des techniques d'analyse du texte ainsi que des méthodes d'extraction des propriétés du texte, comme le style et la mise en page. Ces méthodes permettent de donner de meilleurs résultats que celles qui se basent sur les balises Meta du code source des pages HTML. Nous évaluons aussi l'influence du déséquilibre entre les classes sur le résultat de la classification. Nous comparons pour cela les résultats obtenus en appliquant certaines techniques de ré-échantillonnage telles que ENN, NCL et SMOTE.
Dans une dernière étude, nous proposons une méthode pour décrire automatiquement une ressource pédagogique avec des concepts qui lui sont spécifiques. Nous distinguons deux types de concepts : les concepts définis et les concepts prérequis. Ce travail est ensuite exploité afin de réaliser une méthode d'ordonnancement automatique des ressources pédagogiques.
Soutenance : 03/05/2011
Membres du jury :
Mme Bernadette Bouchon-Meunier, Directeur de recherche, CNRS
M Nicolas Labroche, Maître de conférence à l'UPMC
M Bernt Aman, Professeur à l'UPMC
Mme Florence Sèdes, Professeur à l'université Paul Sabatier, Toulouse [Rapporteur]
M Bruno Crémilleux, Professeur à l'université de Caen [Rapporteur]
M Charles Tijus, Professeur à l'université Paris 8 (Examinateur)
Mme Monique Baron, Maître de conférence à l'UPMC
Publications 2009-2015
-
2015
- S. Changuel, N. Labroche, B. Bouchon‑Meunier : “Resources Sequencing Using Automatic Prerequisite--Outcome Annotation”, ACM Transactions on Intelligent Systems and Technology, vol. 6 (1), ACM Transactions on Intelligent Systems and Technology, pp. 6:1-6:30, (ACM) (2015)
-
2011
- S. Changuel : “Métadonnées pour la personnalisation et l’accès à la connaissance”, soutenance de thèse, soutenance 03/05/2011, direction de recherche Bouchon-meunier, Bernadette, co-encadrement : Labroche, Nicolas (2011)
- S. Changuel, N. Labroche : “Distinguishing defined concepts from prerequisite concepts in learning resources”, IEEE Symposium on Computational Intelligence and Data Mining, SSCI 2011 Conference, Paris, France, pp. 22-29, (IEEE) (2011)
-
2010
- S. Changuel, N. Labroche, B. Bouchon‑Meunier : “Automatic Concept Type Identification from learning Resources”, 2010 International Joint Conference on Neural Networks, IJCNN, Barcelone, Spain, pp. 1-6, (IEEE) (2010)
-
2009
- S. Changuel, N. Labroche, B. Bouchon‑Meunier : “Automatic Web Pages Author Extraction”, FQAS 2009 - 8th International Conference on Flexible Query Answering Systems, vol. 5822, Lecture Notes in Computer Science, Roskilde, Denmark, pp. 300-311, (Springer) (2009)
- S. Changuel, N. Labroche, B. Bouchon‑Meunier : “A General Learning Method for Automatic Title Extraction from HTML Pages”, MLDM 2009 - 6th International Conference on Machine Learning and Data Mining in Pattern Recognition, vol. 5632, Lecture Notes in Computer Science, Leipzig, Germany, pp. 704-718, (Springer) (2009)