FAKERI TABRIZI Ali

doctorant à Sorbonne Université
Équipe : MLIA
https://perso.lip6.fr/Ali.Fakeri-Tabrizi

Direction de recherche : Patrick GALLINARI

Co-encadrement : AMINI Massih-Reza

Apprentissage Semi-supervisé Multi-vues: Une Application pour L'annotation d'Image et la Classification de Documents Multilingues

Dans cette thèse , nous présentons deux méthodes d'apprentissage Multi-vues . Dans une première approche , nous décrivons une stratégie de multi-vues auto-apprentissage qui  apprends différents classifieurs de vote sur les différents points de vue. Les distributions de marge sur les données d'apprentissage vierge, obtenus avec chaque  classifieur spécifique à la vue sont ensuite utilisées pour estimer une borne supérieure de leur erreur de Bayes transductive. Minimiser cette borne supérieure nous donne  une marge de seuil automatique qui est utilisé pour attribuer des pseudo-labels à des exemples non étiquetés. Étiquettes pour les classes finales sont ensuite affectés à ces exemples,  par un vote à l'ensemble de la précédente pseudo -labels . Nouveaux classifieurs vue spécifiques sont ensuite apprises à l'aide des données d'apprentissage pseudo- étiquetés et les données étiquetées l'original.  Nous considérons applications à l'image-texte et la classification de documents multilingues.
Dans la deuxième approche , nous proposons un modèle du ranking bipartite semi-supervisé multivues qui nous permet de tirer parti de l'information contenue dans ensembles non-étiquetées d'images pour améliorer   les performances de prédiction , en utilisant plusieurs descriptions ou des vues d'images. Pour chaque catégorie de sujet , notre approche apprend d'abord autant rankers spécifique à la vue qu'il ya de vues disponibles en utilisant les données étiquetées seulement. Ces rankers sont ensuite améliorées itérativement en ajoutant paires d'exemples pseudo- étiquetés sur lesquels tous les rankers spécifiques à la vue sont d'accord sur le classement des exemples au sein de ces couples .
Nous rapportons sur les expériences réalisées sur l'ensemble des données NUS- WIDE , qui montrent que le processus de ranking multi-vues améliore la performance prédictive quand un petit nombre d'exemples étiquetés est disponible spécialement pour les classes de sujets déséquilibrés . Nous montrons également que notre approche permet d'obtenir des améliorations significatives sur un état ​​de l' art multi-vues semi-supervisé modèle de classification . Nous présentons des résultats expérimentaux sur la collection NUS- WIDE et sur ​​Reuters RCV1 - RCV2 qui montrent que, malgré sa simplicité, notre approche est concurrentiel  avec d'autres techniques de l'état de l'art.

Soutenance : 30/09/2013

Membres du jury :

Mr. Glotin, Hérvé. Univ. Sud Toulon Var [Rapporteur]
Mr. Quenot, Georges. Office B-109 Campus Scientifique [Rapporteur]
Mr. Artières, Thierry. LIP6, Université Pierre et Marie Curie
Mr. Gallinari, Patrick. LIP6, Université Pierre et Marie Curie
Mr. Amini, Massih-reza. LIG/AMA

Date de départ : 13/01/2014

Publications 2008-2015