GAO Sheng
Direction de recherche : Patrick GALLINARI
Co-encadrement : DENOYER Ludovic
Prédiction de liens par modèles à facteurs latents
Avec la croissance d'Internet et celle des médias sociaux, les données relationnelles, qui décrivent un ensemble d'objets liés entre eux par différents relations, sont devenues courantes. En conséquence, une grande variété d'applications, telles que les systèmes de recommandation, l'analyse de réseaux sociaux, la fouille de données Web ou la bioinformatique, ont motivé l'étude de techniques d'apprentissage relationnel. Parmi le large éventail de ces techniques, nous traitons dans cette thèse le problème de prédiction de liens.
Le problème de la prédiction de liens est une tache fondamentale de l'apprentissage relationnel, consistant à prédire la présence ou l'absence de liens entre objets, à partir de la topologie du réseau et/ou les attributs des objets. Cependant, la complexité et la sparsité des réseaux font de cette tache un problème ardu. Dans cette thèse, nous proposons des solutions pour faciliter l'apprentissage dans le cas de différentes applications.
Dans le chapitre 3, nous présentons un cadre unifié afin de traiter le problème générique de prédiction de liens. Nous discutons les différentes caractéristiques des modèles des points de vue probabiliste et computationnel. Ensuite, en se focalisant sur les applications traitées dans cette thèse, nous proposons des modèles à facteurs latents pour deux types de taches de prédiction de liens: (i) prédiction structurelle de liens et (ii) prédiction temporelle de liens.
Concernant la prédiction structurelle de liens, nous proposons dans le chapitre 4 une nouvelle application que nous appellons Prédiction de Motifs de Liens (PML). Nous introduisons un facteur latent spécifique pour différents types de relations en plus de facteurs latents pour caractériser les objets. Nous présentons un modèle de factorisation tensorielle dans un cadre Bayésien pour révéler la causalité intrinsèque de l'interaction sociale dans les réseaux multi-relationnels. De plus, étant donné la structure complexe des données relationnelles, nous proposons dans le chapitre 5 un modèle qui incorpore simultanément l'effet des facteurs de caractéristiques latentes et l'impact de la structure en blocs du réseau.
Concernant la prédiction temporelle de liens dans les réseaux dynamiques, nous proposons dans le Chapitre 6 un modèle latent unifié qui intègre des sources d'information multiples, la topologie globale du réseau, les attributs des noeuds et les informations de proximité du réseau afin de capturer les motifs d'évolution temporelle des liens. Ce modèle joint repose sur la factorisation latente de matrices et sur une techniques de régularisation pour graphes.
Chaque modèle proposé dans cette thèse a des performances comparables ou supérieures aux méthodes existantes. Des évaluations complètes sont conduites sur des jeux de données réels pour démontrer leur performances supérieures sur les méthodes de base. La quasi-totalité d'entre eux ont fait l'objet d'une publication dans des conférences nationales ou internationales.
Soutenance : 19/06/2012
Membres du jury :
GAUSSIER Eric (Professeur à l'Université Joseph Fourier) [Rapporteur]
YVON François (Professeur à l'Université Paris-Sud) [Rapporteur]
ROSSI Fabrice (Professeur à l'Université Paris 1 Panthéon-Sorbonne)
NADIF Mohamed (Professeur à l'Université Paris Descartes)
DENOYER Ludovic (Maitre de Conférences à l'Université Pierre et Marie Curie)
GALLINARI Patrick (Professeur à l'Université Pierre et Marie Curie)
Publications 2010-2017
-
2017
- L. Qiu, Sh. Gao, Q. Lyu, J. Guo, P. Gallinari : “A novel non-Gaussian embedding based model for recommender systems”, Neurocomputing, (Elsevier) (2017)
-
2016
- Y. Zhao, Sh. Gao, P. Gallinari, J. Guo : “A Novel Multimodal Deep Neural Network Framework for Extending Knowledge Base”, Computación y sistemas, vol. 20 (3), pp. 459-466, (Instituto Politécnico Nacional IPN Centro de Investigación en Computación) (2016)
-
2015
- Y. Zhao, Sh. Gao, P. Gallinari, J. Guo : “Knowledge base completion by learning pairwise-interaction differentiated embeddings”, Data Min. Knowl. Discov., vol. 29 (5), pp. 1486-1504 (2015)
-
2013
- Sh. Gao, L. Denoyer, P. Gallinari, J. Guo : “Latent factor blockmodel for modelling relational data”, 35th European Conference on IR Research, ECIR 2013, vol. 7814, Lecture Notes in Computer Science, Moscou, Russian Federation, pp. 447-458, (Springer) (2013)
-
2012
- Sh. Gao : “Prédiction de liens par modèles à facteurs latents”, soutenance de thèse, soutenance 19/06/2012, direction de recherche Gallinari, Patrick, co-encadrement : Denoyer, Ludovic (2012)
- Sh. Gao, L. Denoyer, P. Gallinari, J. Guo : “Probabilistic Latent Tensor Factorization Model for Link Pattern Prediction in Multi-relational Networks”, The Journal of China Universities of Posts and Telecommunications, vol. 19 (2), pp. 172-181 (2012)
- Sh. Gao, L. Denoyer, P. Gallinari : “Link Prediction via Latent Factor Blockmodel”, WWW'12 - The 21st International Conference on World Wide Web, Lyon, France, pp. 507-508, (ACM) (2012)
- Sh. Gao, L. Denoyer, P. Gallinari : “Modeling Relational Data via Latent Factor Blockmodel”, (2012)
-
2011
- Sh. Gao, L. Denoyer, P. Gallinari : “Prédiction de Liens Temporels en Intégrant les Informations de Contenu et de Structure”, Seconde conférence sur les Modèles et l′Analyse des Réseaux : Approches Mathématiques et Informatique, Grenoble, France, pp. 1-14 (2011)
- Sh. Gao, L. Denoyer, P. Gallinari : “Temporal Link Prediction by Integrating Content and Structure Information”, the 20th ACM international conference on Information and knowledge management, CIKM'11, Glasgow, United Kingdom, pp. 1169-1174, (ACM) (2011)
- Sh. Gao, L. Denoyer, P. Gallinari : “Link pattern prediction with tensor decomposition in multi-relational networks”, CIDM 2011 - IEEE Symposium on Computational Intelligence and Data Mining, Paris, France, pp. 333-340, (IEEE) (2011)
-
2010
- Sh. Gao, L. Denoyer, P. Gallinari : “Prédiction de Motifs Relationnels par Décomposition Tensorielle dans les Réseaux Sociaux”, Workshop Reiso 2010, Marseille, France, pp. 51-58 (2010)