BINSZTOK Henri
Direction de recherche : Patrick GALLINARI
Co-encadrement : ARTIÈRES Thierry
Apprentissage de Modèles Markoviens pour l'Analyse de Séquences
Nous nous sommes intéressés à l'apprentissage de modèles pour le traitement de données séquentielles. Les applications concernent par exemple la modélisation de signaux d'écriture manuscrite ou l'analyse de traces de navigation d'utilisateurs. Les données séquentielles se prêtent à différentes tâches comme le partitionnement, la classification ou la segmentation. De nombreuses approches ont été proposées pour ces tâches, parmi lesquelles les modèles Markoviens occupent une place privilégiée. Une étape importante de l'apprentissage réside dans le choix de la structure de ces modèles et dans l'initialisation de ceux-ci, avant d'apprendre les paramètres à partir des données. Nous développons des approches pour automatiser l'apprentissage de tels systèmes de traitement de séquences - notamment pour apprendre la structure des modèles. Nous proposons pour cela un cadre d'apprentissage reposant sur des méthodes d'estimation de similarités entre symboles et de construction d'un ensemble de modèles à partir d'un ensemble de séquences. L'apprentissage se fait par simplification d'un modèle initial, pour lequel nous donnons des implémentations optimisées. Nous présentons également des perspectives d'extension à l'apprentissage de modèles hiérarchiques.
Soutenance : 14/09/2007
Membres du jury :
M. Colin DE LA HIGUERA, Professeur à l'Université de Saint-Etienne [Rapporteur]
M. Thierry PAQUET, Professeur à l'Université de Rouen [Rapporteur]
M. Thierry ARTIERES, Professeur à l'Université Paris 6
M. Patrick GALLINARI, Professeur à l'Université Paris 6
M. Bernard MERIALDO, Professeur à l'EURECOM
M. Jean-Luc ZARADER, Professeur à l'Université Paris 6
Publications 2002-2007
-
2007
- H. Binsztok : “Apprentissage de Modèles Markoviens pour l’Analyse de Séquences”, soutenance de thèse, soutenance 14/09/2007, direction de recherche Gallinari, Patrick, co-encadrement : Artières, Thierry (2007)
-
2005
- H. Binsztok, Th. Artières : “Learning Model Structure from Data: An Application to On-Line Handwriting”, Electronic Letters on Computer Vision and Image Analysis, vol. 5 (2), pp. 30-46, (Computer Vision Center Press) (2005)
-
2004
- H. Binsztok, Th. Artières : “Learning HMM Structure for On-line Handwriting Modelization”, 9th IAPR International Workshop on Frontiers in Handwriting Recognition, Tokyo, Japan, pp. 407-412, (IEEE) (2004)
- H. Binsztok, Th. Artières, P. Gallinari : “A model-based approach to sequence clustering”, 16th European Conference on Artificial Intelligence (ECAI 2004), Valencia, Spain, pp. 420-424 (2004)
- H. Binsztok, Th. Artières : “Partitionnement de tracés manuscrits en ligne par modèles Markoviens”, Colloque International Francophone sur l'écrit et le Document (CIFED 2004), La Rochelle, France, pp. 217-222 (2004)
- H. Binsztok, Th. Artières, P. Gallinari : “Un modèle probabiliste de detection en ligne de nouvelevenement”, RFIA, Toulouse, France (2004)
-
2002
- H. Binsztok, P. Gallinari : “Un algorithme en ligne pour la detection de nouveauté dans un flux de documents”, JADT 2002 - 6es Journées internationales d’Analyse statistique des Données Textuelles, Saint-Malo, France (2002)