L’analyse de l’évolution des sujets dans les archives scientifiques est un domaine de recherche crucial qui se concentre sur la compréhension de l’évolution, de l’émergence ou du changement des sujets scientifiques au fil du temps.
Cette thèse vise à tirer parti des techniques avancées d’apprentissage profond pour analyser de grandes collections de documents scientifiques horodatés. En suivant la progression temporelle des documents sémantiquement similaires et de leurs relations de citation, nous contribuons à cette ligne de recherche pour identifier les sujets en évolution, détecter les nouvelles zones d’intérêt et observer les changements de paradigmes scientifiques.
Nos objectifs incluent l’établissement de nouvelles références pour des concepts fondamentaux comme "sujet" et "sujets en évolution", le développement de nouvelles méthodes pour détecter les sujets émergents et les changements de paradigmes, et la création de métriques d’évaluation améliorées pour les modèles de sujets. En relevant des défis tels que la difficulté de définir des notions complexes, le manque de catégorisation standard et l’absence de métriques d’évaluation fiables, cette recherche cherche à repousser les limites de la découverte et de l’innovation scientifiques, en fournissant des insights plus nuancés et précis sur l’évolution des connaissances scientifiques.
Cette analyse offre des insights précieux sur la nature dynamique des connaissances scientifiques, révélant des schémas tels que les sujets émergents, l’intégration des insights provenant de différents domaines et l’ascension ou le déclin de zones de recherche spécifiques.
Les expériences menées au cours de cette recherche ont conduit au développement de plusieurs outils logiciels, chacun conçu pour relever des défis spécifiques en matière de modélisation des sujets et d’analyse de l’évolution des sujets.