MAAG Maria

doctorant à Sorbonne Université
Équipe : MLIA
https://lip6.fr/Maria.Maag

Direction de recherche : Patrick GALLINARI

Co-encadrement : DENOYER Ludovic

Apprentissage automatique de fonctions d’anonymisation pour les graphes et les graphes dynamiques

La confidentialité des données est un problème majeur qui doit être considéré avant de rendre publiques les données ou avant de les transmettre à des partenaires tiers avec comme but d'analyser ou de calculer des statistiques sur ces données. Leur confidentialité est principalement préservée en utilisant des techniques d'anonymisation. Dans ce contexte, un nombre important de techniques d'anonymisation a été proposé dans la littérature. Cependant, des méthodes génériques capables de s'adapter à des situations variées sont souhaitables.
Nous adressons le problème de la confidentialité des données représentées sous forme de graphe, données qui nécessitent, pour différentes raisons, d'être rendues publiques. Nous considérons que l'anonymiseur n'a pas accès aux méthodes utilisées pour analyser les données. Une méthodologie générique est proposée basée sur des techniques d'apprentissage artificiel afin d'obtenir directement une fonction d'anonymisation et d'optimiser la balance entre le risque pour la confidentialité et la perte dans l'utilité des données. La méthodologie permet d'obtenir une bonne procédure d'anonymisation pour une large catégorie d'attaques et des caractéristiques à préserver dans un ensemble de données. La méthodologie est instanciée pour des graphes simples et des graphes dynamiques avec une composante temporelle. La méthodologie a été expérimentée avec succès sur des ensembles de données provenant de Twitter, Enron ou Amazon. Les résultats sont comparés avec des méthodes de référence et il est montré que la méthodologie proposée est générique et peut s'adapter automatiquement à différents contextes d'anonymisation.

Soutenance : 08/04/2015

Membres du jury :

Fabrice Rossi, Professeur, Université Panthéon-Sorbonne (Rapporteur )
Benjamin Nguyen, Professeur, INSA Val de Loire (Rapporteur)
Patrick Gallinari, Professeur, Université Pierre et Marie Curie
Ludovic Denoyer, Professeur, Université Pierre et Marie Curie
Bernd Amann, Professeur, Université Pierre et Marie Curie
Maryline Laurent, Professeur, Télécom SudParis
Philippe Jacquet, Directeur de recherche, Alcatel-Lucent Bell Labs
Hakim Hacid, Professeur associé, Zayed University, Emirats Arabes Unis

Date de départ : 30/09/2015

Publications 2014-2015