REIS DOS SANTOS LOPES Alda
Direction de recherche : Patrick GALLINARI
Un modèle interactif de recherche d'information de documents structurés spécifié par des grammaires attribuées
L'information structurée définie par les formats standards HTML et XML est de plus en plus accessible, soit dans les grandes organisations, soit par l'Internet. Chaque utilisateur recherche des informations correspondant à ses besoins spécifiques parmi les documents des grandes collections disponibles, ce qui constitue un effort pratiquement impossible à réaliser manuellement. Les systèmes de recherche d'information (RI) cherchent à répondre à ce besoin en essayant de retourner les documents, ou les parties de documents, qui abordent le mieux les besoins spécifiés par l'utilisateur. Nous proposons un modèle interactif de RI, où l'utilisateur est guidé pendant la construction de la requête en ayant accès aux résultats intermédiaires de chaque opération. Avec ce paradigme interactif, face aux résultats intermédiaires, l'utilisateur peut mieux choisir l'opération suivante, modifier une opération déjà introduite ou sélectionner tout de suite le sous-ensemble d'éléments qu'il trouve pertinent. Les documents structurés sont représentés, à partir de grammaires attribuées, par des arbres décorés dont les attributs définissent la signification des éléments. Ces arbres représentent uniformément la structure, le contenu et les différentes opérations possibles sur les documents, ce qui permet une meilleure communication entre différentes applications et systèmes. Il est possible de construire automatiquement l'analyseur de documents à partir de la grammaire attribuée correspondante.
Soutenance : 24/01/2005
Membres du jury :
Patrick GALLINARI (Professeur, LIP6), Directeur
Jacques LEMAITRE (Professeur U. Toulon), Rapporteur
Laurent ROMARY (DR Inria, Loria), Rapporteur
Bernd AMANN (Professeur LIP6), Examinateur
Cecile ROISIN (Professeur Inria Rhone-Alpes), Examinatrice
Pedro HENRIQUES (Professeur, U. Minho, Portugal), Examinateur
Publications 2004-2007
-
2007
- S. Gançarski, C. Le Pape, A. Lopes Gançarski : “Freshness Control of XML Documents for Query Load Balancing”, XANTEC, Regensburg, Germany, pp. 35-39, (IEEE) (2007)
-
2006
- A. Lopes Gançarski, A. Doucet, P. Henriques : “Attribute grammar-based interactive system to retrieve information from XML documents”, IEE Proceedings Software, vol. 153 (2), pp. 51-60, (Institution of Engineering and Technology) (2006)
- A. Lopes Gançarski, P. Henriques : “Extensao do XQuery com operaçoes de selecao para a construçao interactiva das perguntas”, XML: Aplicaçoes e Tecnologias Associadas (XATA06), Portalegre, Portugal, pp. 36-47 (2006)
-
2005
- A. Reis Dos Santos Lopes : “Un modèle interactif de recherche d’information de documents structurés spécifié par des grammaires attribuées”, soutenance de thèse, soutenance 24/01/2005, direction de recherche Gallinari, Patrick (2005)
- A. Lopes Gançarski, P. Henriques : “IXQuery: Interactive and Information Retrieval XQuery”, ELPUB 2005 - 9th ICCC International Conference on Electronic Publishing, Leuven, Belgium, pp. 211-216 (2005)
- A. Lopes Gançarski, P. Henriques : “A processing environment for the IXDIRQL XML query language”, IADIS Virtual Multi Conference on Computer Science and Information Systems (MCCSIS 2005), Virtual conference, France (2005)
- A. Lopes Gançarski, P. Henriques : “Construçao e utilizaçao de um prototipo para o processamento da linguagem de interrogaçao IXDIRQL”, XML: Aplicaçoes e Tecnologias Associadas (XATA05), Braga, Portugal, pp. 130-143 (2005)
-
2004
- A. Lopes Gançarski, P. Henriques : “Presenting the Results of Relevance-Oriented Search over XML Documents”, ACM Symposium on Document Engineering (DocEng04), Milwaukee, Wisconsin, United States, pp. 31-33, (ACM) (2004)