BOUKHALED Mohamed Amine
Direction de recherche : Jean-Gabriel GANASCIA
De la stylistique computationnelle: fouille de textes littéraires pour l'extraction de motifs stylistiques caractérisants
Notre thèse se situe dans le domaine interdisciplinaire de la stylistique computationnelle, à savoir l'application des méthodes statistiques et computationnelles à l'étude du style littéraire. Historiquement, la plupart des travaux effectués en stylistique computationnelle se sont concentrés sur les aspects lexicaux. Dans notre thèse, l’accent est mis sur l'aspect syntaxique du style qui est beaucoup plus difficile à analyser étant donné sa nature abstraite. Comme contribution principale, dans cette thèse, nous travaillons sur une approche à l'étude stylistique computationnelle de textes classiques de littérature française d'un point de vue herméneutique, où découvrir des traits linguistiques intéressants se fait sans aucune connaissance préalable. Plus concrètement, nous nous concentrons sur le développement et l'extraction des motifs morphosyntaxiques. Suivant la ligne de pensée herméneutique, nous proposons un processus de découverte de connaissances pour la caractérisation stylistique accentué sur la dimension syntaxique du style et permettant d'extraire des motifs pertinents à partir d'un texte donné. Ce processus proposé consiste en deux étapes principales, une étape d'extraction de motifs séquentiels suivi de l'application de certaines mesures d'intérêt. En particulier, l'extraction de tous les motifs syntaxiques possibles d'une longueur donnée est proposée comme un moyen particulièrement utile pour extraire des caractéristiques intéressantes dans un scénario exploratoire. Nous proposons, évaluons et présentons des résultats sur les trois mesures d'intérêt proposées, basée chacune sur un raisonnement théorique linguistique et statistique différent.
Soutenance : 13/09/2016
Membres du jury :
Jean-Luc MINEL, Professeur [Rapporteur]
Thierry POIBEAU, Directeur de Recherche [Rapporteur]
Valérie BEAUDOUIN Valérie, Directrice d’Études
Jean-Gabriel GANASCIA, Professeur
Christophe MARSALA, CHRISTOPHE Professeur
Henry SOLDANO, Maître de Conférences
Publications 2014-2018
-
2018
- F. Frontini, M. Boukhaled, J.‑G. Ganascia, Th. Charnois, M. Larjavaara : “Approaching French theatrical characters by syntactical analysis: a study with motifs and correspondence analysis”, chapter in The Grammar of Genres and Styles. From Discrete to Non-Discrete Units, vol. 320, Trends in Linguistics. Studies and Monographs [TiLSM], pp. 118-139, (De Gruyter Mouton), (ISBN: 978-3-11-058968-9) (2018)
-
2017
- F. Frontini, M. Boukhaled, J.‑G. Ganascia : “Mining for characterising patterns in literature using correspondence analysis: an experiment on French novels”, Digital Humanities Quarterly, vol. 11 (2), Göttingen Dialog in Digital Humanities 2015, (Alliance of Digital Humanities) (2017)
-
2016
- M. Boukhaled : “De la stylistique computationnelle: fouille de textes littéraires pour l’extraction de motifs stylistiques caractérisants”, soutenance de thèse, soutenance 13/09/2016, direction de recherche Ganascia, Jean-Gabriel (2016)
-
2015
- F. Frontini, M. Boukhaled, J.‑G. Ganascia : “Moliere’s Raisonneurs: a quantitative study of distinctive linguistic patterns”, Corpus Linguistics 2015, Lancaster, United Kingdom (2015)
- M. Boukhaled, F. Frontini, G. Bourgne, J.‑G. Ganascia : “Computational Study of Stylistics: A Clustering-based Interestingness Measure for Extracting Relevant Syntactic Patterns”, International Journal of Computational Linguistics and Applications, vol. 6 (1), (Alexander Gelbukh) (2015)
- F. Frontini, M. Boukhaled, J.‑G. Ganascia : “Linguistic Pattern Extraction and Analysis for Classic French Plays”, Journée ConSciLa (Confrontations en Sciences du Langage), Paris, France (2015)
- M.‑A. Boukhaled, F. Frontini, J.‑G. Ganascia : “A Peculiarity-based Exploration of Syntactical Patterns: a Computational Study of Stylistics”, Workshop on Interactions between Data Mining and Natural Language Processing DMNLP'15 ECML/PKDD 2015 Workshop, Porto, Portugal, pp. 31-40 (2015)
- M.‑A. Boukhaled, F. Frontini, J.‑G. Ganascia : “Une mesure d’intérêt à base de surreprésentation pour l’extraction des motifs syntaxiques stylistiques”, Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles, Caen, France (2015)
- M. Boukhaled : “Une méthode non supervisée pour la vérification d’auteur à base d’un modèle gaussien multivarié”, CORIA 2015 - Conférence en Recherche d'Infomations et Applications, Paris, France, pp. 525-533, (ARIA) (2015)
- M.‑A. Boukhaled, Z. Sellami, J.‑G. Ganascia : “Phoebus : un Logiciel d’Extraction de Réutilisations dans des Textes Littéraires”, 22e Conférence sur le Traitement Automatique des Langues Naturelles, Caen, France (2015)
- M. Boukhaled, J.‑G. Ganascia : “Using Function Words for Authorship Attribution: Bag-Of-Words vs. Sequential Rules”, Natural Language Processing and Cognitive Science Proceedings 2014, Venice, Italy, pp. 115-122, (DE GRUYTER) (2015)
-
2014
- M. Boukhaled, J.‑G. Ganascia : “Probabilistic Anomaly Detection Method for Authorship Verification”, Statistical Language and Speech Processing, vol. 8791, Lecture Notes in Computer Science, Grenoble, France, pp. 211-219 (2014)