LENART Marcin

doctorant à Sorbonne Université
Équipe : LFI
https://lip6.fr/Marcin.Lenart

Direction de recherche : Marie-Jeanne LESOT, Andrzej BIELECKI
Co-encadrement : PEDRISOR Teodora (Thales), REVAULT D'ALLONNES Adrien (Univ. Paris VIII)

Qualité des données et de l'information pour systèmes d'aide à la décision

L'évaluation, ou la cotation, d'informations est une tâche qui vise à mesurer leur qualité, le plus souvent décomposée en plusieurs critères, appelés dimensions, qui permettent de capturer et de combiner différents aspects d’une information. Cette thèse considère le cas d’informations produites par des capteurs qui, le plus souvent utilisés en réseaux, ne fournissent pas toujours une information correcte. Cette thèse propose d’exploiter les spécificités des capteurs pour définir un modèle de cotation d’information dédié, et cependant générique. Les approches existantes pour la cotation d’information produite par les capteurs reposent souvent sur une vérité-terrain ou des méta-informations, ce qui restreint significativement leur généricité : vérité-terrain et méta-informations sont souvent difficiles à obtenir et rendent les approches appropriées uniquement pour des capteurs spécifiques, en exploitant des caractéristiques propres. Nous proposons une approche qui traite ces difficultés en définissant un modèle qui ne fait pas d’hypothèse sur le capteur considéré, ne requiert pas de vérité-terrain et dépend seulement de méta-informations aisées à obtenir, qui exploitent uniquement des attributs partagés par la plupart des capteurs. Le modèle que nous proposons est appelé ReCLiC, du fait des noms en anglais des quatre dimensions sur lesquelles il repose : fiabilité, compétence, vraisemblance et crédibilité, soit Reliability, Competence, Likelihood et Credibility. De façon informelle, le modèle ReCLiC prend en entrée les messages fournis par un ensemble de capteurs et vise à enrichir chacun des messages d’une évaluation numérique de sa qualité. Cette qualité est comprise comme la confiance qui peut être mise dans ce message. L’évaluation de la qualité dépend de la source, le contenu et le contexte du message, qui sont les trois composantes principales d’une information. Nous discutons en détails les contraintes et propriétés souhaitées des quatre dimensions sur lesquelles ReCLiC repose et nous proposons des définitions motivées pour chacune d’entre elles. De plus, nous proposons une implémentation de la définition générique de ReCLiC pour un problème réel, pour un capteur spécifique dans le domaine de la signalisation ferroviaire : nous discutons de leur forme pour cette application et nous effectuons une analyse théorique du comportement du modèle de cotation d’information auquel elles conduisent, en examinant chaque dimension séparément. L’implémentation proposée de ReCLiC est validée expérimentalement en utilisant des données simulées réalistes, créées à partir d’une base de données ferroviaires réelles, fournie par le partenaire industriel de la thèse, Thales. Le protocole expérimental que nous proposons permet de contrôler les problèmes de qualité introduits ainsi que leur nombre, selon quatre scénarios distincts. Cette étude expérimentale porte également sur les paramètres du modèle proposé ReCLiC et permet de montrer qu’il offre le comportement souhaité : en particulier, il possède la capacité d’affecter des scores de confiance faibles aux messages bruités simulés. Enfin le modèle ReCLiC est mis en œuvre pour analyser la base de données ferroviaires réelles. Une nouvelle méthode de visualisation est proposée, pour représenter graphiquement de multiples scores de confiance associés aux messages de multiples capteurs simultanément. Cette visualisation permet d’observer un phénomène de propagation de confiance qui montre comment des messages de faible qualité influencent d’autres messages. De plus, la notion de dynamique de la confiance est introduite et analysée sur ces données.

Mots-clés : qualité de l’information, qualité des données, cotation d’information, confiance, capteurs, fiabilité, compétence, vraisemblance, crédibilité, donnés ferroviaires.


Soutenance : 02/10/2020

Membres du jury :

SCHERER Rafa? (Politechnika Cz?stochowska) [Rapporteur]
SMITS Grégory (IRISA, Lannion) [Rapporteur]
SZMUC Tomasz (AGH, Cracovie)
MARSALA Christophe (LIP6-SU, Paris)
BIELECKI Andrzej (AGH, Cracovie)
LESOT Marie-Jeanne Lesot (LIP6-SU, Paris)
REVAULT D'ALLONNES Adrien (Univ. Paris VIII, Paris)
PEDRISOR Teodora (Thales)

Date de départ : 02/10/2020

Publications 2018-2020

  • 2020
  • 2019
  • 2018
    • M. Lenart, A. Bielecki, M.‑J. Lesot, T. Petrisor, A. Revault D'Allonnes : “Dynamic Trust Scoring of Railway Sensor Information”, ICAISC 2018 - 17th International Conference on Artificial Intelligence and Soft Computing, vol. 10842, Lecture Notes in Computer Science, Zakopane, Poland, pp. 579-591, (Springer) (2018)