Les méthodes d'apprentissage automatique sont devenues courantes dans le domaine de la biomédecine grâce au développement des données génétiques, d'imagerie et cliniques. En particulier, les méthodes de classification sont utilisées pour prédire des phénotypes tels que la survie des patients ou la réponse au traitement. Cependant, les méthodes traditionnelles d'apprentissage automatique manquent souvent d'interprétabilité en raison de leur nature de boîte noire.
Cette thèse se concentre sur une méthode de classification interprétable, la basicEnBMC, qui construit un classifieur d'ensemble basé sur des classifieurs bivariés monotones (BMC) pour prédire des résultats binaires. Nous proposons deux extensions : (1) nous réduisons la complexité temporelle de l'approche basicEnBMC en introduisant une étape de présélection, ce qui conduit à la méthode fastBMC, et (2) nous étendons nos classifieurs à des problèmes de classification ordinale et multiclasse, en généralisant la présélection et en développant la méthode fastMBMC.
Ces modèles ont été appliqués avec succès à divers ensembles de données transcriptomiques et comparés avec d'autres modèles de classification ordinale. Nos méthodes ont permis d'identifier efficacement les mécanismes biologiques menant aux phénotypes, tels que la prédiction du temps de récidive dans le cancer du sein. Ils ont permis d'identifier des biomarqueurs et des voies de signalisation connues, indiquant un potentiel de recherche futur. Dans le domaine de la science alimentaire, nous avons démontré la plus large applicabilité de ces modèles.