MPOULI NJANGA SEH Suzanne

doctorant à Sorbonne Université
Équipe : ACASA
https://lip6.fr/Suzanne.Mpouli-Njanga-Seh

Direction de recherche : Jean-Gabriel GANASCIA

Annotation automatique des figures de comparaison dans les textes littéraires

Cette thèse aborde le problème de la détection automatique des comparaisons figuratives dans des textes littéraires en prose écrits en français ou en anglais et propose un canevas pour décrire ces comparaisons d’un point de vue stylistique. Une comparaison figurative correspond ici à toute structure syntaxique qui met en parallèle au moins deux entités, déroge au principe de compositionnalité et crée une image mentale dans l’esprit de ceux à qui elle est destinée.
Trois éléments principaux distinguent notre approche des travaux précédents : son ancrage dans les théories linguistiques et cognitives sur les comparaisons littérales et figuratives, sa capacité à gérer des marqueurs appartenant à différentes catégories grammaticales et sa flexibilité qui lui permet d’envisager différents scénarios syntaxiques. De fait, nous proposons une méthode comprenant trois modules complémentaires :

  • un module syntaxique qui utilise l'analyse syntaxique de surface et des règles manuelles pour identifier les comparaisons potentielles ainsi que leurs composantes ;
  • un module sémantique qui mesure la saillance des motifs détectés et la similarité sémantique des termes comparés en se basant sur une base de données préétablie ;
  • et un module d’annotation qui fournit entre autres des informations sur le type de comparaison (idiomatique, sensorielle…) et sur les catégories sémantiques employées.
Pour finir, au vu des données recueillies au cours des deux campagnes d’annotation que nous avons menées, il paraît clair que la détection automatique des comparaisons figuratives doit tenir compte de plusieurs facteurs parmi lesquels la saillance, la catégorisation et la syntaxe de la phrase.

Soutenance : 03/10/2016

Membres du jury :

M. Stéphane Ferrari, Maître de conférences [HDR], Université de Caen [Rapporteur]
M. Walter Daelemans, Professeur, Universiteit Antwerpen [Rapporteur]
Mme Catherine Fuchs, Directrice de recherche, LATTICE-CNRS
M. Jean-Gabriel Ganascia, Professeur, UPMC
M. Dominique Legallois, Professeur, Université Sorbonne Nouvelle
Mme Vanda Luengo, Professeur, UPMC

Date de départ : 03/10/2016

Publications 2015-2017