HADJ ALI Mahdi

doctorant à Sorbonne Université
Équipe : DECISION
https://lip6.fr/Mahdi.Hadj-Ali

Direction de recherche : Nicolas MAUDET
Co-encadrement : WUILLEMIN Pierre-Henri, LE BIANNIC Yann

Causalité et explication des modèles prédictifs

Les travaux récents en explicabilité de l'ia (XAI) ont amélioré l'interprétabilité générale des modèles en quantifiant les contributions de chaque variable d'entrée aux prédictions. Malgré ces avancées, les utilisateurs cherchent toujours à obtenir des informations causales sur les mécanismes sous-jacents. À cette fin, une solution possible est de s'appuyer sur l'analyse causale probabiliste classique, qui offre des outils pour quantifier les effets causaux. En s'appuyant sur cette base, cette thèse explore l'intersection entre le machine learning et la causalité, en se concentrant sur la manière dont les modèles prédictifs peuvent être utilisés pour quantifier des effets causaux. Bien que les approches traditionnelles comme les essais randomisés contrôlés offrent des preuves causales robustes, elles sont souvent impraticables dans des scénarios réels. Cette étude examine des méthodes alternatives, telles que la modélisation d'uplift et les meta-learners, qui permettent d'approximer des informations causales à partir de données observationnelles.

Cependant, ces méthodes présentent des limites, notamment en ce qui concerne le choix des bonnes variables pour entraîner le modèle. Identifiant ces lacunes, la thèse introduit de nouvelles méthodologies qui intègrent le raisonnement causal avec les outils d'XAI. Ces méthodologies affinent la quantification des effets causaux en s'assurant que les résultats des modèles sont interprétés dans le contexte de la structure causale sous-jacente. En adaptant les modèles prédictifs à des requêtes causales spécifiques, les méthodologies proposées améliorent l'interprétabilité pour la rapprocher de la compréhension intuitive d'un humain.

Enfin, cette thèse propose également une étude de cas complète utilisant des données synthétiques afin de valider les méthodologies proposées précédemment. En simulant des scénarios de production complexes, nous évaluons rigoureusement la performance des méthodes proposées, démontrant leur robustesse et leur efficacité dans l'estimation des effets causaux, même en présence d'effets indirects et de variables confondantes. Cette validation empirique renforce non seulement les contributions théoriques de la thèse, mais fournit également des perspectives pour l'utilisation de ces travaux dans des contextes réels.


Soutenance : 14/11/2024

Membres du jury :

Marianne CLAUSE, Professeur à l'Université de Lorraine [Rapporteur]
Éric GAUSSIER, Professeur à l'Université Grenoble Alpes [Rapporteur]
Hervé ISAMBERT, Directeur de recherche à l'Institut Curie
Éric SIMON, Directeur de recherche à SAP France
Nataliya SOKOLOVSKA, Examinateur, Professeur à Sorbonne Université.
Nicolas MAUDET, Professeur à Sorbonne Université
Yann LE BIANNIC, Ingénieur de recherche à SAP France
Pierre-Henri WUILLEMIN, Maître de conférences à Sorbonne Université

Date de départ : 15/11/2024

Publications 2021-2024