À propos

De nombreuses organisations disposent de gisements de connaissances inexploités. Ces gisements prennent souvent la forme de dossiers peu structurés et aux contenus hétérogènes qui, à différents niveaux dans ces organisations, enregistrent la mémoire des cas traités. Ce sont par exemple les dossiers d’affaires dans les entreprises ou les dossiers de patients dans les hôpitaux. L’accès à la connaissance engrangée dans ces expériences aiderait souvent à mieux traiter les cas présents. Leur sous-exploitation est due à la difficulté à d’y accéder de façon pertinente, soit par leur indisponibilité sous forme numérique, soit par l’inefficacité d’un accès standard à ces dossiers peu structurés par base de données ou recherche en texte intégral. Pour faire sauter ce verrou, le projet ACCORDYS s’attaque à ce problème par une approche combinée d’ingénierie des connaissances, de traitement de la langue et de recherche d’information. ACCORDYS expérimente ces méthodes dans un domaine où l’accès aux cas passés est particulièrement utile et où son impact sociétal est important : le domaine de la santé, plus particulièrement celui des maladies rares.

L’application choisie pour valider les hypothèses de recherche du projet ACCORDYS consiste en l’exploitation des données biomédicales accumulées au cours des années par des spécialistes de fœtopathologie, discipline particulière de l’embryologie et de la génétique médicales, dont l’objet est l’étude des malformations du fœtus. Ces données sont de nature hétérogène (photos, images d’échographie, images de différentes techniques de radiologie, résultats d’examens biologiques, etc.). Elles sont interprétées par les spécialistes respectifs qui produisent pour la plupart un compte rendu textuel. Dans le contexte du diagnostic prénatal d’une malformation, la connaissance de situations antérieures « similaires » et résolues (c’est-à-dire vérifiées après l’autopsie du fœtus) est essentielle à l’orientation diagnostique. Cette connaissance est précieuse car les malformations diagnostiquées en période prénatale sont très majoritairement des affections rares concernant moins d’un individu sur 2000.

Le problème auquel le projet ACCORDYS se propose donc de répondre est l’impossibilité d’exploiter aujourd’hui simplement l’ensemble des cas connus. Beaucoup des données collectées au cours du temps restent sur leurs supports d’origine et sont inutilisables pour la résolution de nouveaux cas si elles ne sont pas rendues accessibles et si elles ne sont pas agrégées avec des connaissances générales du domaine. Une grande partie des documents (textuels ou images) qui nous intéressent sont sur des supports non numériques et quand les plus récents sont sur des supports numériques, ils ne sont pas indexés correctement. Il est ainsi actuellement impossible de retrouver les cas de patients présentant une pathologie identique. L’objectif du projet répond donc à un besoin urgent de réunir toutes ces données et de les rendre accessibles aisément afin d’utiliser au mieux cette mémoire collective.

main_schema

Notre hypothèse de recherche est la suivante : Analyser les dossiers (après numérisation si nécessaire) leur apportera une valeur ajoutée en termes de connaissances, permettant ainsi de construire une base de connaissances du domaine. Les dossiers seront structurés et enrichis par indexation à l’aide de ressources termino-ontologiques et par leur mise en relation avec des connaissances externes (publications, bases de données). Une telle base permettra l’accès à des cas similaires.

Le cadre du travail pour ce projet est une recherche fondamentale pluridisciplinaire. Du point de vue médical, c’est une manière de regrouper les connaissances et de les modéliser dans le domaine des maladies rares. D’un point de vue de l’accès au contenu, il s’agit de faire des progrès dans les méthodes d’enrichissement et d’accès sémantique aux documents indépendamment du domaine.