Jean-Pascal M.

La meilleure façon de ne pas avancer est de suivre une idée fixe (J. Prévert)

L’ambitieux projet MédiaWorks

Posted by Jean-Pascal sur 8 octobre 2004

Durant les trois premières années de ma thèse au LIMSI, j’ai été financé grâce au projet MediaWorks. Le projet MédiaWorks vise à produire une plateforme d’indexation de documents audiovisuels par le contenu.

J’ai participé activement à la conception du prototype d’indexation, Emmanuel Jamin s’occupant de son côté de l’aspect recherche d’information. Le logiciel fait l’intégration d’un certain nombre de technologies d’analyse du signal (via une plateforme multi agents développée par AEGIS) fournies par différents partenaires tels que l’INRIA ou l’IRISA. La conception a été guidée par une analyse fine de l’activité des documentalistes de la vidéothèque de TF1.

Par de nombreux aspects, ce projet, comme tant d’autres avant lui, a montré que le chemin était grand avant qu’une plateforme logicielle fournissant une aide réelle à l’indexation n’existe. Je parle volontairement d’aide à l’indexation et non pas d’indexation automatique, car les besoins réels des documentalistes sont aujourd’hui impossible à satisfaire automatiquement. En effet,  

« L’homme, imprégné d’un contexte, porte son attention sur des objets et des relations précises, et leur donne sens. De plus, il apparaît qu’une grande partie des informations faisant sens pour les interlocuteurs sont d’un niveau d’abstraction supérieur à celui du signal brut ou de la détection des formes ». (Extrait de ma thèse, p.147).

Comme le souligne B. Bachimont dans Corpus et connaissances (2005)

Il faut produire plus un modèle de l’expression qu’un modèle de la signification.

Cependant, si vous êtes intéressés par ce projet, vous pouvez lire la suite du billet.

 Le projet MediaWorks est un projet ambitieux (thématique II D de PRIAMM)  qui a été financé par le Ministère et l’économie, des finances et de l’industrie réunit trois laboratoires CNRS (LISMI, INRIA-Rocquencourt et INRIA-Rennes), deux partenaires privés (TF1 et AEGIS) ainsi que des intervenants extérieurs.

Cartographie des partenaires MediaWorks

Cette forte collaboration découle de l’ambition du projet qui doit utiliser des méthodes de recherche d’information (RI) classiques (métadonnées associées au document audiovisuel) conjointement à des méthodes récentes d’analyse numérique de contenu. Ces nouvelles méthodes portent sur des modalités vidéo, image et texte qui doivent être hydridées pour une description sémantique du contenu. L’hybridation propose un enrichissement mutuel de ces modalités audio, vidéo et textuelles. Ainsi l’enjeu du projet se place à deux niveaux : au niveau de l’hétérogénéité de l’architecture logicielle et au niveau de l’hybridation des données à un niveau sémantique.
 L’application développée est un serveur de documents audiovisuels pour la recherche d’informations dans le service documentaire de TF1. En 2002, la vidéothèque de TF1 contenait 250 000 vidéos subissant une croissance d’environ 24 000 vidéos par an. TF1 trouve son intérêt dans ce projet par la valorisation de sa vidéothèque, valorisation obtenue par une plus grande efficacité de recherche. Au sein du projet, TF1 fournit un savoir faire métier, un corpus et un terrain pour l’évaluation du systèmes développé.

 Liens pour le projet :

Page de Chafik Kermad : http://www.irisa.fr/vista/Equipe/Anciens/Chafik.Kermad.english.html

 Contribution au projet

Puisque nous nous situons volontairement dans une logique de conception centrée utilisateur, un soin particulier a été accordé à la définition des besoins (recueil des besoins exprimés, promotion de nouveaux besoins). J’ai ainsi mené :

  • l’analyse de l’existant et observation de l’activité (en collaboration avec Emmanuel Jamin)

Analyse de l’existant

L’observation des opérateurs documentalistes se fait à trois niveaux de l’activité. Pour chaque niveau un type d’observation est privilégié, ainsi qu’une méthode.

  • l’analyse des besoins et spécification fonctionnelle (en collaboration avec Emmanuel Jamin).

  • l’élaboration d’un modèle d’activité d’indexation facilitant la plannification de l’activité

  • la spécification d’interfaces d’indexation et des interfaces de gestion du workflow (intégration des processus de traitement automatique)

  • la spécification de formats de données permettant l’hydridation de métadonnées hétérogènes.

Workflow d’indexation des vidéos 

Cette figure montre le workflow d’indexation d’une fiche MAVI (Métadonnées Associées à la Vidéo pour l’Indexation) pour le projet MédiaWorks. Aux différents temps de l’analyse sont associés les formats de métadonnées adaptés.

  • la conception d’un éditeur WYSIWYG de fichiers XML formaté par une transformation XSL.

Screenshot de l’interface principale d’indexation

Éditeur XML WYSIWYG de la plateforme MédiaWorks. 1 – navigateur de plan ; 2 – bandeau synthétique ; 3 – Magnétoscope ; 4 – Zone d’annotation textuelle 5 ; explorateur de document ; 6 – outils d’annotation pour les références.

  • le développement du module permettant l’hybridation des données suivant une logique de type tableau noir.

projetmw_clip_image002_0000.gif

La figure si dessus montre un Système Multi Agent dans lequel les agents fonctionnels (agent d’interface, Directory Facilitator et agents fonctionnels) reçoivent des messages d’activation de l’agent tableau noir. Ce dernier récupère des agents logiciels des messages pour enrichir le tableau (des triplets de signe encapsulés dans des messages ACL). En parallèle, les agents fonctionnels peuvent être appelés par l’agent utilisateur pour réaliser des traitements sur le signal.

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

 
%d blogueurs aiment cette page :