CARON Clément

doctorant à Sorbonne Université
Équipe : BD
https://lip6.fr/Clement.Caron

Direction de recherche : Bernd AMANN

Co-encadrement : CONSTANTIN Camelia

Provenance et Qualité dans les Workflows Orientés Données : Application à la Plateforme WebLab

La plateforme Weblab est un environnement de définition et d’exécution de chaines de traitements média-mining développé par le service IPCC1 d’Airbus Defence and Space. Il s’agit d’une plateforme ouverte d’intégration de composants externes dont la richesse permet aux concepteurs de construire des chaines média-mining très complexes, mais pose également des problèmes liés à la sensibilité de la qualité des résultats par rapport aux composants utilisés. Avant le début de cette thèse, aucun outil n’existait pour l’analyse et l’amélioration de la qualité de workflows WebLab. La problématique principale de la thèse repose sur le fonctionnement dit boite noire des services WebLab.
L’approche choisie est non-intrusive : nous complétons la définition du workflow WebLab par des règles de provenance et de propagation de qualité. Les règles de provenance génèrent des liens de dépendance dit grains-fins entre les données et les services après l’exécution d’une chaine de traitements WebLab. Les règles de propagation de qualité profitent des liens inférés précédemment pour raisonner sur l’influence de la qualité d’une donnée utilisée par un service sur la qualité d’une donnée produite.
Les contributions apportées par cette thèse sont :

  1. un modèle de génération de liens de provenance reposant sur l’utilisation de règles de dépendance entre les données.
  2. un modèle de propagation de valeurs de qualité sur un graphe de provenance.
  3. une extension de l’architecture WebLab avec l’implémentation de nos deux modèles, ainsi qu’une interface utilisateur.

Soutenance : 03/11/2015

Membres du jury :

VIDAL Maria Esther, Université Simon Bolivar, Venezuela (PR, CV attaché) [Rapporteur]
GRIGORI Daniela, PR/HDR Université de Dauphine [Rapporteur]
VARGAS-SOLAR Genoveva, CR CNRS/HDR LIG Grenoble
MARSALA Christophe, PR UPMC (EDITE)
AMANN Bernd, PR UPMC (EDITE)
CONSTANTIN Camelia, MCF UPMC (EDITE)

Date de départ : 31/12/2015

Publications 2013-2015