POULAIN Rémy

doctorant à Sorbonne Université
Équipe : ComplexNetworks
https://lip6.fr/Remy.Poulain

Direction de recherche : Clémence MAGNIEN

Co-encadrement : TARISSAN Fabien

Analyse et modélisation de la diversité des structures relationnelles à l’aide de graphes multipartis

Il n’est plus à prouver que le numérique, Internet et le web ont entraîné une révolution notamment dans la manière de s’informer. Comme toute révolution, elle est suivie par une série d’enjeux : égalité de traitement des utilisateurs et des fournisseurs, consommations écologiquement durables, liberté d’expression et censure, etc. Il est nécessaire que la recherche apporte une vision claire de ces enjeux.
Parmi ces enjeux, nous pouvons parler de deux phénomènes : le phénomène de chambre d’écho et le phénomène de bulle de filtre. Ces deux phénomènes sont liés au manque de diversité de l’information visible sur internet, et on peut se demander l’impact des algorithmes de recommandations. Même si ceci est notre motivation première, nous nous éloignons de ce sujet pour proposer un cadre scientifique général pour analyser la diversité. Nous trouvons que le formalisme de graphe est assez utile pour pouvoir représenter des données relationnelles. Plus précisément, nous allons analyser des données relationnelles avec des entités de différentes natures. C’est pourquoi nous avons choisi le formalisme de graphe n-partie car c’est une bonne manière de représenter une grande diversité de données.
Même si nos premières données étudiées seront en lien avec les algorithmes de recommandation (consommation musicale ou achat d’article sur une plateforme) nous allons voir au fil du manuscrit en quoi ce formalisme peut être adapté à d’autres types de données (utilisateurs politisés sur Twitter, invités d’émissions de télévision, installation d’ONG dans différents États...). Il y a plusieurs objectifs dans cette étude :

  • Définir mathématiquement des indicateurs de diversité sur les graphes n-parties ;
  • Définir algorithmiquement comment les calculer;
  • Programmer ces algorithmes pour en faire un objet informatique utilisable ;
  • Utiliser ces programmes sur des données assez variées ;
  • Voir les sens différents que nos indicateurs peuvent avoir.
Nous commencerons par décrire le formalisme mathématique nécessaire à notre étude. Puis nous appliquerons notre objet mathématique à des exemples de base pour y voir toutes les possibilités que notre objet nous offre. Ceci nous montrera l’importance de normaliser nos indicateurs, et nous motivera à étudier une normalisation par l’aléatoire. Ensuite nous verrons une autre série d’exemples qui nous permettront d’aller plus loin sur nos indicateurs, en dépassant le côté statique et triparti pour aborder des graphes avec plus de couches et dépendant du temps. Pour pouvoir avoir une meilleure vision de ce que les données réelles nous apportent, nous étudierons nos indicateurs sur des graphes complètement générés aléatoirement.

Soutenance : 04/12/2020

Membres du jury :

Mme ROBARDET Céline (Professeure au LIRIS), [Rapporteure]
M ABDESSALEM Talel (Professeur à l'INFRES), [Rapporteur]
Mme LUENGO Vanda (Professeure au Lip6), Examinatrice
M CAZABET Rémy (Maître de conférence au LIRIS)
M HERVE Nicolas (Chercheur à l'INA)
M. BENBOUZID Bilel (Maître de conférence au LISIS)
Mme MAGNIEN Clémence (Directrice de Recherche au Lip6)
M TARISSAN Fabien (Chercheur CNRS à l'ENS Paris Saclay)

Date de départ : 31/12/2020

Publications 2018-2021