Apprentissage supervisé par génération de règles : le système SUCRAGE
A. Borgi - Ben Bouzid
LIP6 1999/008:
THÈSE de DOCTORAT de l'UNIVERSITÉ PARIS 6 LIP6 /
LIP6
research reports
269 pages - Janvier/January 1999 -
French document.
PostScript :
2416 Ko /Kb
Contact : par
mail / e-mail
Thème/Team: Apprentissage et Acquisition de Connaissances
Titre français : Apprentissage supervisé par génération de règles : le système SUCRAGE
Titre anglais : Supervised learning by automatic rules generation : the SUCRAGE system
Résumé : Face à une quantité de données chaque jour plus importante, la détection de structures et de liens particuliers, l'organisation et la recherche de connaissances exploitables dans cette masse d'information deviennent un enjeu stratégique pour la prise de décision et la prédiction. Ce problème complexe, désigné par « Extraction de Connaissances à partir de Données », possède de multiples aspects. Nous nous sommes intéressés à l'un d'entre eux : l'apprentissage supervisé. Nous proposons une méthode d'apprentissage à partir d'exemples qui se situe à la jonction des méthodes statistiques et de celles basées sur des techniques d'Intelligence Artificielle. Notre modélisation se base sur la génération automatique de règles de classification et sur une utilisation originale du raisonnement approximatif. La fonction de classement, directement donnée sous la forme d'une base de règles de production, assure la transparence et l'interprétabilité du classifieur.
La méthode d'apprentissage proposée est multi-attributs, elle permet de prendre en compte l'éventuel pouvoir prédictif d'une conjonction d'attributs pris simultanément. Le partitionnement de l'espace des entrées permet d'avoir une représentation multi-valente des attributs et d'intégrer la notion d'imprécision des données. L'incertitude des règles, également prise en compte, est gérée aussi bien dans la phase d'apprentissage que dans celle de la reconnaissance. Afin d'introduire plus de souplesse et pour pallier aux problèmes des frontières dus à la discrétisation, nous proposons la mise en oeuvre d'un raisonnement approximatif. L'originalité de notre approche réside dans l'utilisation du raisonnement approximatif proposé non plus uniquement comme un mode d'inférence et de gestion de connaissances imprécises, mais pour affiner l'apprentissage et valider la base de règles.
La méthode proposée a été implémentée dans un système baptisé SUCRAGE et confrontée à une application réelle dans le domaine du traitement d'images. Les résultats obtenus sont très satisfaisants. Ils permettent de valider notre approche et nous autorisent à envisager d'autres domaines d'application.
Abstract : Facing the increase of data amount recorded daily, the detection of both structures and specific links between them, the organisation and the search of exploitable knowledge in this information become a strategic stake for decision holding and prediction task.
This complex problem known as Data Mining has multiple aspects. We focus on one of them : supervised learning. We propose a learning method from examples situated at the junction of statistical methods and those based on Artificial Intelligence techniques. Our modelisation is based on automatic generation of classification rules and on an original use of approximate reasoning. The classification function is directly given in the form of production rules base. This ensures the transparency and easy interpretation of the classifier.
The proposed learning method is multi-features, it allows to take into account the possible predictive power of a simultaneously considered features conjunction. The feature space partition allows a multi-valued representation of the features and data imprecision integration. The rule uncertainty is managed in the learning phase as well as in the recognition one. To introduce more flexibility and overcome the boundary problem due to the discretisation, we propose to use approximate reasoning. The originality of our approach lies in using the proposed approximate reasoning not only as an inference mode and to manage imprecise knowledge, but also to refine learning and validate the rule base.
The proposed method was implemented in a tool called SUCRAGE and confronted with a real application in the field of image processing (multi-components image segmentation). The obtained results are very satisfactory. They validate our approach and allow us to consider other application fields.
Mots-clés : Apprentissage supervisé, règles de production, imprécision, incertitude, raisonnement approximatif, traitement d'images
Key-words : Supervised learning, production rules, imprecision, uncertainty, approximate reasoning, image processing
Publications internes LIP6
1999 / LIP6 research reports
1999
Responsable
Éditorial / Editor :Valerie.Mangin@lip6.fr