Partenaires

Octogone
Logo CNRS Logo UT2J
Logo MSHS-T



Rechercher

Sur ce site


Accueil du site > Projets en cours > Parolothèque

Parolothèque

par admin - 6 janvier 2013

La parole des patients en cancérologie est une source majeure d’informations. Or les évolutions technologiques rendent maintenant possibles le stockage et le traitement automatique du contenu de la parole à différents niveaux (acoustiques, linguistiques et métalinguistiques…). La parole en cancérologie peut être considérée comme un échantillon biographique pouvant être conservée dans une "parolothèque" à l’instar des échantillons tumoraux conservés dans une tumorothèque. C’est pourquoi nous proposons de créer une base de données de paroles et de méta-données concernant les patients mais aussi les praticiens ancrées dans l’interdisciplinarité (linguistique, informatique, psychologique, médicale ...) et mettant en jeu les compétences complémentaires des partenaires.

Dans le domaine des sciences du langage (discipline de l’équipe porteuse), et notamment dans le domaine des troubles de la parole, existent des séries d’enregistrements réalisées dans des buts de recherche ou dans le but de suivi de population. Le traitement de ces enregistrements repose généralement sur une transcription manuelle, longue et délicate, d’autant plus difficile que la parole peut être distordue, difficilement intelligible. Il alimente une recherche spécifique dans le domaine du traitement automatique des langues. L’idée de ne pas perdre ces données et de les mettre à la disposition de la communauté scientifique existe déjà et a motivé des projets de recherche comme en témoigne l’ ANR DESPHO-APADY (http://despho-apady.univ-avignon.fr) ou l’appel à projet ANR corpus 2012 en cours d’évaluation .

Appliquée au domaine de la cancérologie, cette problématique concerne les cancers des voies aérodigestives et les tumeurs cérébrales. Mais elle peut surtout être étendue quelle que soit la localisation et le type de tumeur, à d’autres domaines des sciences humaines et sociales, notamment dans l’épidémiologie, la psychologie et sociologie. Ainsi, les interviews de patients réalisés dans le cadre de la recherche sont souvent enregistrés et transcrits manuellement. Bien que ces entretiens soient orientés en fonction des objectifs de la recherche, ils représentent une ressource linguistique dont peut être extraites d’autres informations. Dans un cadre défini par le contexte de la recherche initiale (ou originelle), une catégorisation sémantique du contenu peut permettre une lecture psychologique voir épidémiologique ou sociologique. Une automatisation de la transcription « sophistiquée » comprenant si besoin le repérage des différents locuteurs, la segmentation à partir d’une catégorisation sémantique, rendrait réalisable cette réutilisation de la série d’interviews. La parolothèque serait ainsi alimentée par des recherches en SHS. Elle alimenterait elle-même une recherche dans le domaine du traitement automatique des langues et fournirait un service facilitant la recherche pour les autres disciplines.

Ainsi la question à l’origine de cette demande est : Est-il possible, en analogie au tumorothèque, de stocker puis de traiter automatiquement des paroles de patients atteints de cancer afin de faire des recherches a posteriori grâce à une analyse du discours utilisant les nouvelles techniques de Traitement Automatique de la Langue Naturelle Orale (TALNO) et de Reconnaissance Automatique de la Parole (RAP) ?

Les équipes participant au projet ont les compétences techniques requises mais n’ont jamais collaborés dans ce but.

Les champs d’applications d’un tel dispositif seraient très étendus avec par exemple la recherche de facteurs épidémiologiques à partir d’interviews, ou l’analyse de contenu d’un entretien semidirigé à visée sociologique ou psychologique. Du fait de l’expérience de l’équipe porteuse du projet, les questions relatives à l’impact des troubles de la communication induites par la pathologie cancéreuse sur les relations du patient et la qualité de vie peuvent être un exemple d’application plus précis (ex l’amélioration de l’intelligibilité de la parole à la suite des cancers des voies aérodigestives ou des tumeurs cérébrales, formalisation du discours dans les relations patients-soignants, l’impact des troubles de la communication sur la qualité de vie…).

La conception d’une telle parolothèque comprend trois étapes :(1) Enregistrement de la parole et archivage, (2) Enrichissement et structuration de la base, (3) Traitement automatique des sources et une analyse à toutes les étapes des aspects éthiques, juridiques et réglementaires.

Ce projet a pour objectif l’étude des meilleures solutions techniques et structurelles pour créer cette parolothèque (en anticipant les liens avec les autres bases de données comme les tumorothèques) et de proposer les recherches qui pourront l’alimenter. Ainsi cette étude de faisabilité comprendra ; (1) une analyse des expériences existantes dans d’autres domaines d’application (comme le centre de resources du discours oral : http://sldr.org), (2) l’étude des plateformes susceptibles d’accueillir les ressources et notamment la possibilité d’utiliser la plateforme PETRA de l’Université du Mirail à Toulouse ( http://petra.univ-tlse2.fr), (3) Les besoins à chaque étape en terme de recommandations ou de protocoles en faisant la part entre ceux qui existent déjà et ceux qui nécessiteraient un travail d’élaboration,(4) l’élaboration (ou la mise en place) de cadres éthiques, juridiques et réglementaires et son impact sur chaque étape (en s’inspirant des tumorothèques), (5) la préparation de 3 projets qui pourront amorcer le fonctionnement de la parolothèque.

Le déroulement de cette étude peut être décomposé de la manière suivante :

(1) Analyse des expériences similaires relevant de deux niveaux d’expertises : un niveau technique et un niveau juridique et réglementaire dont la durée peut être évaluée à 1 mois de travail.

(2) Présentation des résultats de cette analyse aux différentes équipes interessées avec invitation des experts extérieurs repérés (LIA et LPL)et constitution des groupes de travail pour l’étude de chaque étape avec détermination de la feuille de route de chaque groupe.

(3) Réunion de travail de chaque groupe 2 fois avec un délai d’au moins 1 mois entre les 2 pour répondre à la mission et repérer les axes de recherche nécessaires et les pistes de recherche pouvant "profiter" de la parolothèque.

(4) Présentation plénière aux institutions susceptiples d’être interessées du cancéropole du GSO permettant de préciser les projets de recherche et de mettre en rapport les équipes pouvant les élaborer.

5) Rédaction des projets dans les domaines d’applications identifiés.

Sur un calendrier prévisionnel en mois démarrant à partir du recrutement du personnel.

- M 0-M3 : travail d’analyse de l’existant
- M3 Réunion de mise en route des groupes de travail
- M3-M4 échanges dans chaque groupe pour répondre à la feuille de route
- M4 Première réunion des groupes de travail
- M4-M5 poursuite des échanges après une première synthèse intermédiaire
- M5 Deuxième réunion des grou