LIP6 2002/022

  • Soutenance de thèse
    Bases de données multidimensionnelles floues et leur utilisation pour la fouille de données
  • A. Laurent
  • 231 pages - 20/09/2002- document en - http://www.lip6.fr/lip6/reports/2002/lip6.2002.022.pdf - 4,739 Ko
  • Contact : Anne.Laurent (at) nulllip6.fr
  • Ancien Thème : APA
  • Devant l'accroissement des volumes de données à traiter, les entrepôts de données se sont développés depuis le début des années 1990 afin de fournir aux décideurs des systèmes dédiés à l'analyse des données. Les systèmes opérationnels, utilisés pour les applications transactionnelles (OLTP - On-Line Transaction Processing), se sont vite révélés inadaptés pour les environnements décisionnels. Les bases de données multidimensionnelles ont donc émergé pour répondre aux besoins spécifiques d'analyse multidimensionnelle en ligne (OLAP - On-Line Analytical Processing). Cependant, les données issues du monde réel sont souvent entachées d'imperfection et les requêtes que les utilisateurs souhaitent poser sont souvent vagues. La théorie des sous-ensembles flous permet d'améliorer les systèmes d'information, notamment pour l'interprétation qualitative de données quantitatives (numériques). Les informations présentées à l'utilisateur (sous forme de règles par exemple)sont plus compréhensibles et se généralisent mieux. L'objectif de notre travail est donc de définir un cadre formel pour la mise en ouvre de systèmes de fouille de données floues avec des outils OLAP. Nous proposons une extension du modèle multidimensionnel pour le traitement de données imparfaitement connues et de requêtes flexibles. Ce modèle étendu est intégré dans une architecture comprenant des outils de fouille de données floue. En particulier, nous introduisons un système pour la construction d'arbres de décision flous et la génération automatique de résumés linguistiques à partir de bases de données multidimensionnelles floues, utilisées comme support de fouille de données. Nous étudions également le problème des cellules vides, sous ses aspects sémantiques, pour la recherche d'anomalies.
  • Mots clés : Bases de données multidimensionnelles, OLAP, fouille de données, logique floue, résumés flous
  • Directeur de la publication : Ghislaine.Mary (at) nulllip6.fr