accueil > Recherche > Classification et visualisation > stage Master2 recherche 2016

stage Master2 recherche 2016

mardi 29 novembre 2016


Visualisation-exploration de données multi-dimensionnelles temporelles par une approche facette

Contexte

Le virage numérique a fait évoluer la société et de nombreux gestes de notre quotidien sont maintenant en liaison avec de la donnée numérique. Ces actions engendre des quantités énormes de données multi-dimensionnelles traitant de type de valeurs différentes : les positions géographiques, les adresses internet, les images, les requêtes. À ces dimensions s’ajoute naturellement la dimension temporelle, et on évoque la notion de trace (time series voir Aigner pour un état de l’art). La compréhension de ces données et la recherche de propriétés, comme similitude, corrélation ou encore périodicité sont de grande importance et la statistique nous fournit de nombreuses grandeurs pour l’analyse. Mais l’humain a besoin de représentation, de se construire un modèle mental.

Les données multi-dimensionnelles sont rapidement difficiles à représenter dès que le nombre de dimensions excède 3. L’évolution temporelle de ces données ajoute une difficulté supplémentaire. La visualisation et l’exploration de telles données fait l’objet de recherche depuis de nombreuses années et différents paradigmes ont été proposés dans la littérature.

L’approche facette, introduite par Ranganathan, a prouvé son adaptation aux données multi-dimensionnelles non temporelles. Son principe est le suivant : pour chaque dimension, chaque valeur atteinte est indiquée avec le nombre d’objets de la base possédant cette valeur. L’utilisateur peut alors sélectionner dans une dimension d , une valeur précise v comme filtre et l’affichage des autres dimensions se met à jour en ne gardant que les objets qui ont la valeurs v dans la dimension d. C’est l’approche qu’on trouve sur de nombreux sites marchand. Pour un site d’électroménager, on aura, par exemple, les dimensions : prix, marque, type, consommation. À chaque sélection la liste d’objets se met à jour. Sur ces sites, les données sont, en général, en mode texte, le nombre d’occurence n’est communiqué à l’utilisateur que sous forme textuelle.

L’approche Elastic List, proposée par Stefaner 4, garde le principe de l’approche facette pour le filtrage et la navigation, mais communique graphiquement sur le nombre d’occurrences en présentant des listes dont les éléments ont des tailles en liens avec le nombre d’occurrences. De plus, l’affichage est adaptatif et continu ; les éléments apparaissent et disparaissent progressivement, conservant le model mental de l’utilisateur (voir http://well-formed-data. net/experiments/elastic_lists/).

Sujet

Le sujet de stage (de recherche et rémunéré), porte sur l’extension de l’approche elastic list aux données temporelles. Quels affichages, quelles méthodes d’exploration, de navigation et de sélection sont les plus adaptées en fonction des besoins de l’utilisateur. Après une bibliographie sur les données temporelles et sur l’approche facette, le stagiaire proposera de nouvelles approches, les codera et des tests seront effectués. Les compétences attendues sont l’ouverture, un attrait pour la visualisation et pour l’interaction.

contacter Eric Languénou eric.languenouU@univ-nantes.fr (enlever le dernier U de languenou)

Références

Wolfgang Aigner, Silvia Miksch, Wolfgang Müller, Heidrun Schumann, and Christian Tominski. Visualizing time-oriented data-a systematic view. Comput. Graph., 31(3):401–409, June 2007. ISSN 0097-8493.

S.R Ranganathan. Elements of library classification (1st ed). Bombay, New York : South Asia Books, 1991.

Moritz Stefaner and Boris Muller. Elastic lists for facet browsers. In Proceedings of the 18th International Conference on Database and Expert Systems Applications, DEXA ’07, pages 217–221, Washington, DC, USA, 2007. IEEE Computer Society. ISBN 0-7695-2932-1.



  • SPIP