LI Ke
Direction de recherche : Bernd AMANN
Co-encadrement : NAACKE Hubert
Explorer l'évolution des sujets dans les grandes archives scientifiques avec des graphiques croisés dynamiques
Il existe une demande croissante d’outils pratiques pour explorer l’évolution de la recherche scientifique publiée dans des archives bibliographiques telles que le Web of Science (WoS), arXiv, PubMed ou ISTEX. L’extraction et l’exploration de schémas ou motifs d’évolution à partir de ces archives a de nombreuses applications et peut être étendue pour synthétiser des récits à partir de ressources textuelles dans d’autres domaines comme les archives journalistiques, les textes juridiques ou les textes littéraires. Dans cette thèse, nous proposons un modèle de données et un langage d’interrogation pour la visualisation et l’exploration de graphes d’évolution de sujets (topics) de recherche. Notre modèle est indépendant d’une méthode particulière d’extraction de sujets et de leur alignement temporel dans un graphe d’évolution. Il inclut un ensemble de métriques sémantiques et structurelles pour caractériser et filtrer des motifs d’évolution de sujets significatifs. Ces métriques sont particulièrement utiles pour la visualisation et l’exploration de grands graphes d’évolution. Nous présentons également un prototype d’implémentation de notre modèle sur Apache Spark et les résultats expérimentaux obtenus pour quatre archives de documents du monde réel.
Soutenance : 22/06/2021
Membres du jury :
Mirian Halfeld Ferrari, Professeure, Université d’Orléans, LIFO [Rapporteur]
Nicolas Travers, Maître de conférences HDR, ESILV, De Vinci Research Center [Rapporteur]
?Nathalie Aussenac-Gilles, Directrice de Recherche CNRS, Université de Toulouse, IRIT
Clémence Magnien, Directrice de Recherche CNRS, Sorbonne Université, LIP6
Bernd Amann, Professeur, Sorbonne Université, LIP6
Hubert Naacke, Maître de conférences, Sorbonne Université, LIP6
Publications 2017-2021
-
2021
- K. Li : “Exploring Topic Evolution in Large Scientific Archives with Pivot Graphs”, soutenance de thèse, soutenance 22/06/2021, direction de recherche Amann, Bernd, co-encadrement : Naacke, Hubert (2021)
- K. Li, H. Naacke, B. Amann : “An Analytic Graph Data Model and Query Language for Exploring the Evolution of Science”, Big Data Research, vol. 26, pp. 100247, (Elsevier) (2021)
-
2020
- K. Li, H. Naacke, B. Amann : “EPIQUE: A Graph Data Model and Query Language for Exploring the Evolution of Science”, BDA 2020 : 36e Conférence sur la Gestion de Données – Principes, Technologies et Applications., Paris (virtual), France (2020)
- K. Li, H. Naacke, B. Amann : “EPIQUE: Extracting Meaningful Science Evolution Patterns from Large Document Archives”, International Conference on Extending Database Technology (EDBT), Copenhagen, Denmark (2020)
- K. Li, H. Naacke, B. Amann : “Exploring the Evolution of Science with Pivot Topic Graphs”, International Workshop on Big Data Visual Exploration and Analytics BigVis at EDBT 2020, Copenhague, Denmark (2020)
-
2019
- H. Naacke, K. Li, B. Amann, O. Curé : “Efficient similarity-based alignment of temporally-situated graph nodes with Apache Spark”, IEEE International Conference on Big Data, High Performance Big Graph Data Management, Analysis, and Mining, Los Angeles, CA, United States, pp. 4793-4798, (IEEE), (ISBN: 978-1-7281-0858-2) (2019)
-
2017
- X. Ren, O. Curé, H. Naacke, J. Lhez, K. Li : “Strider R: Massive and Distributed RDF Graph Stream Reasoning”, IEEE International Conference on Big Data, Boston, United States, pp. 3358-3367, (IEEE) (2017)