MINETTO Rodrigo
Direction de recherche : Matthieu CORD
Co-encadrement : NEUCIMAR J. Leite
Reconnaissance de Zones de Texte et Suivi d'Objects dans les Images et les Vidéos
Dans cette thèse, nous abordons trois problèmes de vision par ordinateur: (1) la détection et la reconnaissance d'objets de texte dans des images de scènes réelles; (2) le suivi de ces objets de texte dans une vidéo numérique, et (3) le suivi d'objets 3D rigides et arbitraires avec des amers connus dans une vidéo numérique. Pour chaque problème, nous avons développé des algorithmes innovants, qui sont au moins aussi précis et robustes que les algorithmes de l'état de l’art. Plus précisément, pour la reconnaissance de texte, nous avons développé (et largement évalué) un nouveau descripteur basé sur HOG, et dédié au traitement du texte Roman, baptisé T-HOG. Nous avons montré sa valeur en tant que post-filtre pour un détecteur de texte existant (SnooperText). Nous avons également amélioré l’algorithme SnooperText en développant une approche multi-échelle pour traiter des caractères de taille très différentes tout en limitant la sensibilité de l'algorithme aux différents artéfacts. Pour le suivi des objets de textes, nous avons décrit quatre manières de combiner la détection et le suivi, et nous avons développé un tracker particulier, basé sur un filtre particulaire exploitant le T-HOG. Pour le suivi des objets rigides, nous avons développé un nouvel algorithme précis et robuste (AFFTRACK) qui combine le KLT tracker avec une calibration améliorée de la caméra. Nous avons largement testé nos algorithmes sur plusieurs bases de données de la littérature. Nous avons également créé plusieurs bases de données pour l’évaluation des algorithmes de détection, suivi de textes et de suivi d'objets rigides dans les vidéos.
Soutenance : 19/03/2012
Membres du jury :
Patrick PÉREZ - Senior Researcher à Technicolor Research Innovation [Rapporteur]
Arnaldo de A. ARAÚJO - Professeur à l’Université Feredal de Minas Gerais (UFMG) [Rapporteur]
Nicolas THOME - Maitre de Conférences à l’Université Pierre et Marie Curie (Paris 6)
Neucimar J. LEITE - Professeur à l’Université Estadual de Campinas (UNICAMP)
Matthieu CORD - Professeur à l’Université Pierre et Marie Curie (Paris 6)
Jorge STOLFI - Professeur à l’Université Estadual de Campinas (UNICAMP)
Hélio PEDRINI - Professeur à l’Université Estadual de Campinas (UNICAMP)
Marcin DETYNIECKI - CR CNRS à l’Université Pierre et Marie Curie (Paris 6)
Publications 2010-2014
-
2014
- R. Minetto, N. Thome, M. Cord, Neucimar J. Leite, J. Stolfi : “SnooperText: A Text Detection System for Automatic Indexing of Urban Scenes”, Computer Vision and Image Understanding, vol. 122, pp. 92-104, (Elsevier) (2014)
-
2013
- R. Minetto, N. Thome, M. Cord, Neucimar J. Leite, J. Stolfi : “T-HOG: an Effective Gradient-Based Descriptor for Single Line Text Regions”, Pattern Recognition, vol. 46 (3), pp. 1078-1090, (Elsevier) (2013)
-
2012
- R. Minetto : “Reconnaissance de Zones de Texte et Suivi d’Objects dans les Images et les Vidéos”, soutenance de thèse, soutenance 19/03/2012, direction de recherche Cord, Matthieu, co-encadrement : Neucimar, J. Leite (2012)
-
2011
- R. Minetto, N. Thome, M. Cord, J. Stolfi, F. Precioso, J. Guyomard, Neucimar J. Leite : “Text Detection and Recognition in Urban Scenes”, International Conference on Computer Vision (ICCV): Workshop on Computer Vision for Remote Sensing of the Environment, Barcelona, Spain, pp. 227-234, (IEEE) (2011)
- R. Minetto, N. Thome, M. Cord, Neucimar J. Leite, J. Stolfi : “SNOOPERTRACK: TEXT DETECTION AND TRACKING FOR OUTDOOR VIDEOS”, IEEE International Conference on Image Processing (ICIP), Brussels, Belgium, pp. 505-508, (IEEE) (2011)
-
2010
- R. Minetto, N. Thome, M. Cord, J. Fabrizio, B. Marcotegui : “Snoopertext: A multiresolution system for text detection in complex visual scenes”, ICIP 2010 - 17th IEEE International Conference on Image Processing, Hong-Kong, Hong Kong, pp. 3861-3864, (IEEE) (2010)