LI Ke

doctorant à Sorbonne Université
Équipe : BD
https://lip6.fr/Ke.Li

Direction de recherche : Bernd AMANN

Co-encadrement : NAACKE Hubert

Explorer l'évolution des sujets dans les grandes archives scientifiques avec des graphiques croisés dynamiques

Il existe une demande croissante d’outils pratiques pour explorer l’évolution de la recherche scientifique publiée dans des archives bibliographiques telles que le Web of Science (WoS), arXiv, PubMed ou ISTEX. L’extraction et l’exploration de schémas ou motifs d’évolution à partir de ces archives a de nombreuses applications et peut être étendue pour synthétiser des récits à partir de ressources textuelles dans d’autres domaines comme les archives journalistiques, les textes juridiques ou les textes littéraires. Dans cette thèse, nous proposons un modèle de données et un langage d’interrogation pour la visualisation et l’exploration de graphes d’évolution de sujets (topics) de recherche. Notre modèle est indépendant d’une méthode particulière d’extraction de sujets et de leur alignement temporel dans un graphe d’évolution. Il inclut un ensemble de métriques sémantiques et structurelles pour caractériser et filtrer des motifs d’évolution de sujets significatifs. Ces métriques sont particulièrement utiles pour la visualisation et l’exploration de grands graphes d’évolution. Nous présentons également un prototype d’implémentation de notre modèle sur Apache Spark et les résultats expérimentaux obtenus pour quatre archives de documents du monde réel.

Soutenance : 22/06/2021

Membres du jury :

Mirian Halfeld Ferrari, Professeure, Université d’Orléans, LIFO [Rapporteur]
Nicolas Travers, Maître de conférences HDR, ESILV, De Vinci Research Center [Rapporteur]
?Nathalie Aussenac-Gilles, Directrice de Recherche CNRS, Université de Toulouse, IRIT
Clémence Magnien, Directrice de Recherche CNRS, Sorbonne Université, LIP6
Bernd Amann, Professeur, Sorbonne Université, LIP6
Hubert Naacke, Maître de conférences, Sorbonne Université, LIP6

Date de départ : 21/06/2021

Publications 2017-2021