CARON Clément
Direction de recherche : Bernd AMANN
Co-encadrement : CONSTANTIN Camelia
Provenance et Qualité dans les Workflows Orientés Données : Application à la Plateforme WebLab
La plateforme Weblab est un environnement de définition et d’exécution de chaines de traitements média-mining développé par le service IPCC1 d’Airbus Defence and Space. Il s’agit d’une plateforme ouverte d’intégration de composants externes dont la richesse permet aux concepteurs de construire des chaines média-mining très complexes, mais pose également des problèmes liés à la sensibilité de la qualité des résultats par rapport aux composants utilisés. Avant le début de cette thèse, aucun outil n’existait pour l’analyse et l’amélioration de la qualité de workflows WebLab. La problématique principale de la thèse repose sur le fonctionnement dit boite noire des services WebLab.
L’approche choisie est non-intrusive : nous complétons la définition du workflow WebLab par des règles de provenance et de propagation de qualité. Les règles de provenance génèrent des liens de dépendance dit grains-fins entre les données et les services après l’exécution d’une chaine de traitements WebLab. Les règles de propagation de qualité profitent des liens inférés précédemment pour raisonner sur l’influence de la qualité d’une donnée utilisée par un service sur la qualité d’une donnée produite.
Les contributions apportées par cette thèse sont :
- un modèle de génération de liens de provenance reposant sur l’utilisation de règles de dépendance entre les données.
- un modèle de propagation de valeurs de qualité sur un graphe de provenance.
- une extension de l’architecture WebLab avec l’implémentation de nos deux modèles, ainsi qu’une interface utilisateur.
Soutenance : 03/11/2015
Membres du jury :
VIDAL Maria Esther, Université Simon Bolivar, Venezuela (PR, CV attaché) [Rapporteur]
GRIGORI Daniela, PR/HDR Université de Dauphine [Rapporteur]
VARGAS-SOLAR Genoveva, CR CNRS/HDR LIG Grenoble
MARSALA Christophe, PR UPMC (EDITE)
AMANN Bernd, PR UPMC (EDITE)
CONSTANTIN Camelia, MCF UPMC (EDITE)
Publications 2013-2015
-
2015
- C. Caron : “Provenance et Qualité dans les Workflows Orientés Données : Application à la Plateforme WebLab”, soutenance de thèse, soutenance 03/11/2015, direction de recherche Amann, Bernd, co-encadrement : Constantin, Camelia (2015)
-
2014
- C. Caron, B. Amann, C. Constantin, P. Giroux, A. Santanchè : “Provenance-Based Quality Assessment and Inference in Data-Centric Workflow Executions”, OTM 2014 Conferences - Confederated International Conferences: CoopIS, and ODBASE 2014, vol. 8841, Lecture Notes in Computer Science, Amantea, Italy, pp. 130-147 (2014)
- C. Caron, B. Amann, C. Constantin, P. Giroux : “WePIGE: The WebLab Provenance Information Generator and Explorer”, 17th International Conference on Extending Database Technology, EDBT 2014, Athens, Greece, pp. 664-667 (2014)
-
2013
- B. Amann, C. Constantin, C. Caron, P. Giroux : “WebLab PROV: Computing fine-grained provenance links for XML artifacts”, BIGProv'13 Workshop (in conjunction with EDBT/ICDT), Gênes, Italy, pp. 298-306, (ACM) (2013)