Les méga-données (ou big data) sont difficiles à gérer de manière cohérente et efficace à cause de leur volume, leur dynamicité et la complexité de leur structure. Lors de mon exposé, j'aborderai tout d’abord mes travaux de recherche sur le routage de transactions et la migration de données dans les infrastructures réparties de type cluster. Ensuite je présenterai mes contributions sur le traitement et l'optimisation de requêtes réparties et leur application au raisonnement dans les graphes de connaissance et à l’analyse du web des sciences. Finalement, je discuterai des perspectives de mes travaux et leur extension avec des méthodes d’apprentissage automatique.