Cette thèse propose de s'intéresser au problème de l'apprentissage statistique sous contrainte de budget, notamment concernant l'information utilisée par le système de prédiction. Les approches classiques d'apprentissage statistique utilisent généralement le seul aspect de la performance en prédiction pour évaluer la qualité d'un modèle, ignorant le coût potentiel du système, par exemple en ressources utilisées en apprentissage (nombre d'exemples, nombre d'étiquettes, mémoire) ou en inférence (nombre de caractéristiques). Nous proposons plus particulièrement dans ce manuscrit plusieurs approches pour l'inférence sous contrainte de coût d’acquisition des caractéristiques. L'objectif est de développer des modèles qui apprennent à interagir avec les données afin d'optimiser un compromis entre une bonne prédiction et un faible coût d'acquisition. Nous présentons tout d'abord un modèle de sélection statique de caractéristiques appliqué au démarrage à froid en recommandation. Nous présentons ensuite deux méthodes d'acquisition adaptatives de caractéristiques, qui permettent un meilleur compromis coût/prédiction dans un cadre plus général. Nous proposons d'utiliser des méthodes d'apprentissage de représentations avec des architectures type réseaux de neurones récurrents. La dernière partie de la thèse s'intéresse au coût lié aux étiquettes, usuellement dénommé apprentissage actif dans la littérature. Nous présentons une approche nouvelle de ce problème en utilisant le méta-apprentissage ainsi qu'une première instanciation basée sur des réseaux récurrents bi-directionnels.