VACHERET Romain

Doctorant à Sorbonne Université
Équipe : MoVe
    Sorbonne Université - LIP6
    Boîte courrier 169
    Couloir 25-26, Étage 2, Bureau 203
    4 place Jussieu
    75252 PARIS CEDEX 05

01 44 27 87 71
Romain.Vacheret (at) nulllip6.fr
https://lip6.fr/Romain.Vacheret

Direction de recherche : Tewfik ZIADI

Détection Automatique de Bugs dans le contexte de la Réparation Automatique de Programmes

Les logiciels sont aujourd'hui omniprésents, qu’il s’agisse, par exemple, d’infrastructures critiques ou d’applications du quotidien. Malgré les progrès des méthodologies de développement et des pratiques de test, les systèmes logiciels demeurent vulnérables aux fautes. Le processus de débogage, indispensable pour localiser et corriger ces erreurs, reste coûteux tant en temps qu'en ressources financières.

Pour répondre à ce défi, le domaine de recherche de la Fault Localization (FL) s'est développé, avec pour objectif d’identifier automatiquement les éléments fautifs d'un programme.

Selon le type de données exploitées, plusieurs familles d'approches ont été proposées. Parmi les plus répandues figurent Spectrum-Based Fault Localization (SBFL), fondée sur l'analyse de l’exécution de tests et Information Retrieval Fault Localization (IRFL), qui s'appuie sur des artefacts textuels tels que les rapports de fautes.

La granularité constitue un aspect essentiel de la Fault Localization. Les techniques existantes opèrent souvent à des niveaux élevés, tels que le fichier ou la méthode, laissant le niveau des instructions relativement peu étudié. Au niveau instruction, l’efficacité des méthodes issues de l’Information Retrieval (IR) est limitée par la faible quantité d’information textuelle disponible dans chaque instruction. Cette thèse propose de dépasser cette limitation en combinant SBFL et IRFL au niveau des instructions.

La première contribution introduit une approche hybride combinant SBFL et IRFL afin de pallier leurs limites respectives. Plus précisément, elle intègre Ochiai, issu de SBFL et Latent Dirichlet Allocation (LDA), issu de IRFL. Cette combinaison permet de tirer parti des forces complémentaires des deux techniques et améliore la précision de la localisation des fautes au niveau des instructions.

Sur cette base, la deuxième contribution aborde la problématique de la localisation multi-fautes.

Les instructions y sont regroupées en fragments de code sur lesquels est appliqué un Algorithme Evolutionnaire (AE) pour explorer l'espace des fragments possibles.

Chaque fragment est évalué à l'aide d'une fonction de fitness combinant les scores Ochiai et LDA.

Le fragment le plus performant est ensuite converti en un classement conforme aux sorties standards de la Fault Localization.

La troisième contribution répond au manque d'information contextuelle au niveau des instructions, un enjeu majeur pour les approches IRFL.

Bien que les instructions soient souvent traitées comme des entités indépendantes, elles appartiennent en réalité à des blocs sémantiques définis par leur contexte structurel et leur flot de données.

Pour exploiter ce contexte, une stratégie d'expansion de documents reposant sur deux volets complémentaires est proposée.

Le premier enrichit chaque instruction avec les noms prétraités de sa classe, de sa méthode et, le cas échéant, de son commentaire associé.

Le second ajoute des termes issus de lignes reliées par un graphe de relations de variables.

Les résultats expérimentaux montrent que cette expansion améliore la qualité de la localisation par rapport aux approches IRFL dépourvues de mécanisme d'expansion.

Ensemble, ces trois contributions répondent aux principaux défis de la Fault Localization au niveau des instructions : la limitation des sources de données prises isolément, la complexité inhérente aux fautes multiples et le manque de contexte sémantique propre aux instructions courtes.

Ce travail ouvre ainsi de nouvelles perspectives pour affiner la localisation des fautes et prépare le terrain à de futures recherches dans le domaine de la Fault Localization automatisée.


Soutenance : 08/12/2025 - 10h - Campus Pierre et Marie Curie, salle Jacques Pitrat (25-26/105)

Membres du jury :

Nadjib Lazaar, Professeur des universités [Rapporteur]
Nawal Guermouche, Maître de conférences HDR [Rapporteur]
Chouki Tibermacine, Professeur des universités
Jean-François Pradat-Peyre, Professeur des universités
Tewfik Ziadi, Maître de conférences HDR

Publications 2024