Recherche d'information-WEB

IS3013AA - CÚline Hudelot

 

Objectif :

 

Le récent développement du WEB ainsi que l’extraordinaire croissance du contenu numérique dans notre environnement numérique a actualisé la problématique de la recherche d'information (Information Retrieval) en y apportant de nouveaux challenges  Les thèmes couverts par la recherche d'information sont assez larges et les défis sont donc actuels et très nombreux. L’objectif de ce cours est de présenter les fondements et les avancées récentes dans ce domaine.

 

Contenu :

 

Les thèmes suivants seront abordés :

 

·       les problèmes sous-jacents de l'indexation et de la recherche d'information, la représentation des besoins en information et des documents, les modèles mathématiques et informatiques en recherche d’information (modèle booléen, vectoriel et probabiliste),  

·       l’évaluation, les techniques de retour de pertinence, le filtrage et l’extraction d’information textuelle.

 

Le cas particulier de la recherche WEB sera aussi détaillé et le cours permettra notamment d’apporter une réponse aux questions suivantes : « Comment marche Google ? Quel est le modèle théorique sous-jacent ? ». On s’intéressera aussi plus précisément à la recherche d’information multimodale, plus particulièrement la recherche d’images, de vidéos et de documents multimédia.

 

Enfin, les défis actuels tels que la prise en compte du multilinguisme, le web sémantique, la modélisation des utilisateurs, le filtrage collaboratif, etc., seront étudiés à partir de papiers de recherche récents.

 

Organisation :

 

L’évaluation de cours se fera d’une part par la réalisation d’un mini-projet qui mettra en application l’ensemble des notions abordées sur une application réelle et d’autre part par un exposé sur un article scientifique récent.


Gestionnaire(s) de IS3013AA : CÚline Hudelot
Administrateur de Les cours : TICE ECP
Utilise la plate-forme Claroline © 2001 - 2008