Cluster 13

Projet Corpus numériques

Le français parlé en interaction : essais de diachronie courte.

5 mars 2008
contact : Véronique Traverso

1 - contexte scientifique et objectifs du projet / 2 - description du projet, méthodologie / 3 - résultats attendus

Le projet entend valoriser et exploiter des corpus de données orales en interaction rassemblées dans une banque de données unique en France, CLAPI (Corpus de langue parlée en interaction) et pionnière sur le plan international. Cette banque de données regroupe de riches corpus d’enregistrements authentiques d’interactions sociales effectués sur plus de 20 ans. Actuellement de nombreuses disciplines (linguistique, sociologie, anthropologie, didactique, histoire orale...) recherchent ce type de données, considérées comme rares et coûteuses : rares parce que la recherche s’y est intéressée tardivement et les chercheurs ayant effectué des enregistrements dans de bonnes conditions écologiques et techniques restent une petite minorité ; coûteuses parce que le processus de production de ces données est long, techniquement sophistiqué, et surtout demande un traitement pour rendre les données accessibles, lisibles sous forme de transcription et exploitables qui repose sur un énorme travail (on compte plus de 10h pour transcrire 1 minute d’interaction).

La banque de données CLAPI permet d’envisager des recherches portant sur
-  les pratiques sociales quotidiennes, les façons de faire et les façons de dire, objet de l’attention des linguistes, ethnographes, sociologues, linguistes, historiens contemporains
-  documentées in situ à travers des enregistrements audio-visuels
-  depuis le début des années 80 Ces recherches sont novatrices dans la mesure où jusqu’ici les travaux sur la parole en interaction, voire sur l’interaction sociale en général portaient sur des données a) audio - alors que CLAPI permet d’envisager des données vidéo, b) de manière qualitative - alors que CLAPI permet d’envisager une approche quantitative en appui de l’analyse qualitative, c) strictement synchrone - alors que CLAPI permet de penser à des analyses diachroniques. En particulier, les analyses diachroniques des pratiques sociales sont encore extrêmement rares : les historiens les reconstruisent sur la base de témoignages ou de documents iconographiques (ce sont des pratiques racontées ou représentées), les anthropologues et sociologues sur la base de récits ou d’interviews - mais il est encore très rare de trouver des études qui puissent se fonder sur leur documentation in vivo. Ce type d’étude a une valeur à la fois scientifique (description et modélisation de la langue et de l’ordre social et culturel basée sur des enregistrements vidéo et audio) et patrimoniale (documentation des pratiques quotidiennes dans leur diversité, leurs variations situées, leur ancrage historique, d’une manière qui vient compléter et enrichir la documentation ethnographique, basée sur des objets de la vie quotidienne, ou la documentation historique, basée sur des récits retraçant les conditions de vie passées). Les pratiques sociales ordinaires viennent ainsi enrichir une vision du patrimoine qui ne se restreint pas à la matérialité (objets, monuments, architecture) mais qui considère que ces matérialités sont un environnement pour le vécu, les gestes, les paroles qui méritent aussi d’être documentés, que ce soit par des traces écrites (corpus textuels) ou des traces audio-visuelles (corpus oraux).

Le projet a pour objectif de décrire des pratiques linguistiques dans leur évolution ces 25 dernières années, en tenant compte non seulement du changement dans le lexique, mais aussi dans les façons de dire et d’interagir. Ces changements sont souvent vus comme une « perte », une « dégradation », un « appauvrissement » qui montrent la vivacité de représentations de la langue comme un patrimoine en train de disparaître et de se défaire. La perspective que nous allons proposer sur le changement n’épouse toutefois pas ces jugements normatifs mais s’attache à décrire ces évolutions et à en montrer la logique, les ressorts, les dynamiques. Les retombées du projet sont plurielles
- il permet d’envisager la description et modélisation de phénomènes dynamiques rarement traités en linguistique, faute de données disponibles. Plus précisément, il vise à décrire le changement linguistique du lexique dans l’interaction et des routines conversationnelles.
- il permet de construire une méthodologie d’analyse inédite, portant sur la comparaison et le changement, intégrant les analyses qualitatives et quantitatives, les analyses « à la main » et les analyses semi-automatisées recourant à des outils informatiques.
— il permet d’exploiter, de valoriser et d’enrichir la base de données CLAPI, un outil unique en France
- il permet de décrire l’évolution d’un patrimoine linguistique en tenant compte de la complexité et de la richesse des situations de parole vive, qui ne peuvent être prises en considération que grâce à des données audio-visuelles.



Établissements rhônalpins engagés :
— Université Lumière Lyon 2 (établissement porteur), ENS-LSH (établissement d’hébergement)
— INSA, Université Claude Bernard Lyon 1, Université Jean Moulin Lyon 3, Université de Savoie (Chambéry), Université Stendhal Grenoble 3, Université Pierre-Mendès France Grenoble 2, Université Jean Monnet Saint-Étienne

Le CNRS participe à travers ses chercheurs à temps plein et son rôle d’opérateur national auprès des unités de recherche ou de service dont il partage la tutelle avec les établissements précités, y compris l’Institut des Sciences de l’Homme.

Dans la seule limite de ses moyens, le cluster a naturellement vocation à faire bon accueil à toute proposition en rapport avec ses thématiques lorsqu’elle émane de collectivités territoriales, d’associations, d’institutions ou d’entreprises rhônalpines.