MAAG Maria
Direction de recherche : Patrick GALLINARI
Co-encadrement : DENOYER Ludovic
Apprentissage automatique de fonctions d’anonymisation pour les graphes et les graphes dynamiques
La confidentialité des données est un problème majeur qui doit être considéré avant de rendre publiques les données ou avant de les transmettre à des partenaires tiers avec comme but d'analyser ou de calculer des statistiques sur ces données. Leur confidentialité est principalement préservée en utilisant des techniques d'anonymisation. Dans ce contexte, un nombre important de techniques d'anonymisation a été proposé dans la littérature. Cependant, des méthodes génériques capables de s'adapter à des situations variées sont souhaitables.
Nous adressons le problème de la confidentialité des données représentées sous forme de graphe, données qui nécessitent, pour différentes raisons, d'être rendues publiques. Nous considérons que l'anonymiseur n'a pas accès aux méthodes utilisées pour analyser les données. Une méthodologie générique est proposée basée sur des techniques d'apprentissage artificiel afin d'obtenir directement une fonction d'anonymisation et d'optimiser la balance entre le risque pour la confidentialité et la perte dans l'utilité des données. La méthodologie permet d'obtenir une bonne procédure d'anonymisation pour une large catégorie d'attaques et des caractéristiques à préserver dans un ensemble de données. La méthodologie est instanciée pour des graphes simples et des graphes dynamiques avec une composante temporelle. La méthodologie a été expérimentée avec succès sur des ensembles de données provenant de Twitter, Enron ou Amazon. Les résultats sont comparés avec des méthodes de référence et il est montré que la méthodologie proposée est générique et peut s'adapter automatiquement à différents contextes d'anonymisation.
Soutenance : 08/04/2015
Membres du jury :
Fabrice Rossi, Professeur, Université Panthéon-Sorbonne (Rapporteur )
Benjamin Nguyen, Professeur, INSA Val de Loire (Rapporteur)
Patrick Gallinari, Professeur, Université Pierre et Marie Curie
Ludovic Denoyer, Professeur, Université Pierre et Marie Curie
Bernd Amann, Professeur, Université Pierre et Marie Curie
Maryline Laurent, Professeur, Télécom SudParis
Philippe Jacquet, Directeur de recherche, Alcatel-Lucent Bell Labs
Hakim Hacid, Professeur associé, Zayed University, Emirats Arabes Unis
Publications 2014-2015
-
2015
- M. Maag : “Apprentissage automatique de fonctions d’anonymisation pour les graphes et les graphes dynamiques”, soutenance de thèse, soutenance 08/04/2015, direction de recherche Gallinari, Patrick, co-encadrement : Denoyer, Ludovic (2015)
-
2014
- M. Maag, L. Denoyer, P. Gallinari : “Graph Anonymization using Machine Learning”, 2014 IEEE 28th International Conference on Advanced Information Networking and Applications, Victoria, Canada, pp. 1111-1118 (2014)