Cluster 13

Projet Corpus numériques

CANU XIX.

5 mars 2008
contact : Geneviève LALLICH-BOIDIN

1- contexte scientifique et objectifs du projet

Objectifs :

L’objectif principal du projet CANU est de valoriser et de mettre en ligne des fonds patrimoniaux de la presse illustrée régionale du XIXème siècle, disponibles au département Documentation Lyon et Rhône-Alpes de la Bibliothèque Municipale de Lyon, pour permettre à terme, l’accès gratuit et à distance de ces fonds, via le portail Internet de la BM.  Il s’agit donc de construire et d’alimenter une base de données contenant les versions textes et images de ces collections. Mais plus important, est la valorisation de ce patrimoine numérique :
- permettre au lecteur de construire ses propres documents à partir de ces sources
- permettre aux professionnels des bibliothèques de construire des parcours thématiques
- offrir au lecteur une reconstruction du contexte spatial et temporel dans lequel ces textes et gravures ont été produits. Une telle application ouvre de nombreux champs de recherche à moyen terme les enjeux de la description de telles collections, sur les notions de territoires et de dimensions temporelles. Contexte scientifique Ce projet émane de l’axe "documents et société" de la nouvelle équipe de recherche de Lyon en sciences de l’information et de la communication (ELICO - EA 4147), qui regroupe la plupart des chercheurs des sciences de l’information et de la communication du site lyonnais, notamment de l’université Lyon 1 et de l’équipe GRESEC-CRISTAL (Université Grenoble 3). Il repose sur quatre piliers. Pilier 1 : des réflexions et résultats d’un groupe de travail sur "le document : un objet vivant" au sein du projet global "le document numérique dans son cycle de vie" porté initialement (2000-2003) par la région au sein d’un projet "ISDN : institut des sciences du document numérique", relayé par le réseau thématique disciplinaire RTP 33 du CNRS : "action spécifique sur le temps et le document numérique".

Ce groupe pluridisciplinaire, regroupant des informaticiens et des spécialistes de l’information a publié ses résultats [ISDN, 2003]. Pilier 2 : le master "Sciences de l’information et des bibliothèques", cohabilité entre l’enssib et l’université Lyon 1. Ce master vise à former des spécialistes de l’information aptes à prendre en compte toutes les dimensions dans la création de nouveaux services d’information numériques : tant techniques que sociales. C’est à l’occasion du stage d’un des étudiants de master à la Bibliothèque Municipale [Landron, 2006] pendant l’été 2006, que nous avons pu percevoir les besoins de la BM en matière de services d’information, sur des documents numérisés. Pilier 3 : une équipe pluridisciplinaire formée d’enseignants-chercheurs principalement issus de l’enssib, de l’équipe ELICO, du LIRIS et du GRESEC-Cristal, ainsi que de professionnels de la Bibliothèque Municipale de la Part-Dieu, et du Service de l’Inventaire du Patrimoine Culturel de Rhône-Alpes, ceux-ci apportant leurs compétences et offrant l’accès à deux ressources qui fondent l’originalité du projet : la Presse Illustrée du XIXème et l’Atlas historique numérique du Grand Lyon. Pilier 4 : le cluster de recherche n°13 de la Région Rhône-Alpes "Culture, patrimoine et création" et notamment le projet "corpus numériques" décliné comme "la constitution de corpus primaires et /ou secondaires à contenu patrimonial et culturel par les moyens de bases de données". Ce projet devrait permettre de fortes connexions avec le thème "Patrimoine et territoire" (voir la tâche T7 : étude des notions de lieux et de territoire"). En outre, il sera une source appréciable de contenus (textes et gravures) pour des études liées aux thèmes "Genre et culture" et "Création" sur la région à la fin XIXème siècle. Par ailleurs, le type d’édition que ce projet propose, ne ressortit pas de l’édition critique au même titre que "l’écho de la fabrique", mais plutôt d’un nouveau type d’édition offert par le numérique qui veillera à re-contextualiser ces documents anciens. Ces mêmes corpus pourraient se prêter parallèlement à une édition critique ; les deux points de vue s’avérant complémentaires. Enfin, ce projet se situe en aval du thème "Numérisation et reconnaissance de documents", car la Presse Illustrée du XIXème est imprimée et ce type de support ne pose pas de problèmes spécifiques de numérisation ni de reconnaissance ; des prestataires externes ont mené cette tâche à bien sur un titre complet "Le Progrès Illustré".

2- description du projet

Ce projet, qui réunit des partenaires lyonnais et grenoblois de différentes institutions et équipes de recherche, se déroule sur deux années pleines (janvier 2008 à décembre 2009) et se prolongera aux travers des travaux de doctorants sur une troisième année. Il est découpé en 12 tâches : des tâches de fond qui perdureront pendant toute la durée du projet et au-delà (les tâches 7, 8 et 9), d’autres plus ponctuelles afin d’avoir un moyen de contrôle sur l’avancée du projet, et enfin une tâche transversale d’animation scientifique (tâche 12). Le calendrier figure en fin de dossier. Ces tâches sont : : T1 - Construction du corpus T2 - Etude des normes et réglementations T3 - Analyse des usages et des usagers T4 Définition des structures des documents et des corpus T5 : Vers une construction des langages d’indexation et de recherche T6 - Analyse et représentation des dimensions temporelles T7- Etudes des notions de lieux et de territoires T8 "Documentarisation de traces personnelles" T9 - Construction d’une interface et développement de l’interface d’assistance aux éditeurs de contenus et à la construction de parcours thématiques pour les professionnels des bibliothèques. T10 - Définition d’une interface et développement de l’interface à destination des lecteurs intégrant une navigation spatiale et temporelle issue des tâches T2, T4 et T5. T11 - Evaluation de l’application T12 - Organisation de journées d’étude et de colloque (Eric Guichard)



Établissements rhônalpins engagés :
— Université Lumière Lyon 2 (établissement porteur), ENS-LSH (établissement d’hébergement)
— INSA, Université Claude Bernard Lyon 1, Université Jean Moulin Lyon 3, Université de Savoie (Chambéry), Université Stendhal Grenoble 3, Université Pierre-Mendès France Grenoble 2, Université Jean Monnet Saint-Étienne

Le CNRS participe à travers ses chercheurs à temps plein et son rôle d’opérateur national auprès des unités de recherche ou de service dont il partage la tutelle avec les établissements précités, y compris l’Institut des Sciences de l’Homme.

Dans la seule limite de ses moyens, le cluster a naturellement vocation à faire bon accueil à toute proposition en rapport avec ses thématiques lorsqu’elle émane de collectivités territoriales, d’associations, d’institutions ou d’entreprises rhônalpines.