FOREST Jason
Direction de recherche : Bernadette BOUCHON-MEUNIER
Co-encadrement : RIFQI Maria
Caractérisation de classes par la découverte automatique de sous-classes
La fouille de données a pour objectif l'extraction de connaissances à partir de grandes bases de données. La caractérisation de données s'inscrit de ce domaine et regroupe les méthodes qui mettent en avant les caractéristiques et les tendances des données. Nos travaux se placent dans le cadre de la caractérisation de données supervisées et se focalisent sur la caractérisation de classe. Dans les jeux de données réelles, il arrive qu'une classe regroupe en son sein plusieurs comportements distincts. On parle alors de classe non-homogène. Ce type de classes pose des problèmes aux méthodes de caractérisation usuelles, comme la construction de prototypes ou de résumés, qui ne sont pas en mesure de détecter les différentes tendances. Pour être correctement prises en compte, les classes non-homogènes nécessitent d'être segmentées en sous-classes pertinentes. Nous proposons, dans notre thèse, une approche novatrice de segmentation automatique de classes en sous-classes qui détecte et isole les différents comportements. Nous proposons également une nouvelle définition du calcul des scores de typicalité qui se base sur ce découpage. Contrairement aux méthodes existantes, qui utilisent un algorithme de clustering, notre approche s'appuie sur l'organisation des classes dans le jeu de données et détecte automatiquement le bon nombre de sous-classes. Notre algorithme permet une amélioration des méthodes de construction de prototypes flous et donne des résultats de caractérisation plus riches. Notre approche a été testée et validée aussi bien sur des jeux de données artificielles que sur des jeux de données réelles issus, par exemple, du marketing pharmaceutique ou encore des bases d'images.
Soutenance : 23/09/2009
Membres du jury :
M. Mohammed Ramdani [Rapporteur]
M. Carl Frélicot [Rapporteur]
M. Matthieu Cord
M. Julien Velcin
Mme. Bernadette Bouchon-Meunier
Mme. Maria Rifqi
Publications 2006-2009
-
2009
- J. Forest : “Caractérisation de classes par la découverte automatique de sous-classes”, soutenance de thèse, soutenance 23/09/2009, direction de recherche Bouchon-meunier, Bernadette, co-encadrement : Rifqi, Maria (2009)
-
2006
- J. Forest, M. Rifqi, B. Bouchon‑Meunier : “Segmentation de classes pour l’amélioration de la construction de prototypes flous : visualisation et caractérisation de classes non homogènes”, Rencontres francophones sur la Logique Floue et ses Applications (LFA 2006), Toulouse, France, pp. 29-36 (2006)
- J. Forest, M. Rifqi, B. Bouchon‑Meunier : “Class Segmentation to Improve Fuzzy Prototype Construction: Visualization and Characterization of Non Homogeneous Classes”, 2006 IEEE International Conference on Fuzzy Systems, Vancouver, Canada, pp. 555-559 (2006)