MEDEM KUATSE Amélie

doctorant à Sorbonne Université
Équipe : NPA
https://lip6.fr/Amelie.Medem

Direction de recherche : Serge FDIDA

Conception de Mécanismes d'Amélioration de la Gestion d'Incidents dans les Réseaux IP

Les réseaux IP des opérateurs acheminent une grande partie des données transitant chaque jour dans le monde, et doivent donc fournir une fiabilité toujours plus importante. Or, ces réseaux sont quotidiennement sujets à des incidents résultant de travaux de maintenance ou de pannes imprévues. Beaucoup de ces incidents sont inévitables parce que leur origine est extérieure aux opérateurs réseaux. De plus, lorsqu'ils surviennent les dégâts sur les réseaux peuvent être considérables. Il est donc important de concevoir des outils pour prévenir l'apparition des incidents ou du moins limiter leurs conséquences sur le réseau. Apporter de l'automatisation au processus de résolution de pannes et à la maintenance permettrait d'accélérer ces procédures et ainsi de réduire le temps d'indisponibilité du réseau. Cette thèse s'intéresse à la détection automatique des incidents réseaux. Pour parvenir à ce but, il est nécessaire d'acquérir une connaissance approfondie des incidents et de leurs effets sur le réseau. Les réseaux IP utilisent des tickets d'incidents pour le suivi de l'évolution de leurs incidents. Les tickets sont des documents textes contenant la description (et donc la cause) des incidents ayant abouti à l'intervention des opérateurs. Les effets des incidents peuvent être observables à travers des messages d'alarmes provenant de sources diverses (par exemple, SNMP, syslogs ---fichiers systèmes des routeurs, protocoles de routage, etc). Dans cette thèse, nous nous intéressons aux messages d'alarmes du routage. Notre principale observation est que l'historique des tickets d'incidents combinés aux messages de routage peut constituer une base de donnée intéressante pour l'analyse des causes des incidents réseaux et de leurs manifestations sur le routage. Nous pouvons donc apprendre la signature des incidents réseaux pour les détecter automatiquement. Nous proposons tout d'abord, Troubleminer, un mécanisme qui se base sur des techniques de fouilles de texte pour (1) extraire automatiquement les causes des incidents à l'intérieur des tickets et (2) structurer les tickets d'incidents dans une hiérarchie facilement exploitable par les opérateurs réseaux. Nous développons ensuite une heuristique pour la mise en liaison des causes des incidents dans les tickets avec leurs événements de routage correspondants, dans deux réseaux IP opérationnels: un opérateur VPN et Internet2. Nous trouvons que 4% (Opérateur VPN) et 23% (Internet2) des événements de routage dans ces réseaux sont critiques, c'est-à-dire coïncident avec des tickets d'incidents. Enfin, nous démontrons la faisabilité de la détection de ces événements critiques à l'aide des algorithmes k-NN et Random Forest. Nos résultats montrent que nous pouvons détecter efficacement 70% d'événements de routage critiques dans les deux réseaux.

Soutenance : 02/02/2011

Membres du jury :

Damien MAGONI, Professeur, Université de Bordeaux [Rapporteur]
Philippe OWEZARSKI, Chercheur, CNRS [Rapporteur]
Patrick GALLINARI, Professeur, UPMC Sorbonne Universités
Nöemie SIMONI, Professeur, ENST Paris
Olivier FESTOR, Chercheur, INRIA
Mickael MEULLE, Chercheur, Orange Labs R&D (France Telecom R&D)
Serge FDIDA, Professeur, UPMC Sorbonne Universités

Date de départ : 02/02/2011

Publications 2007-2013