LIMSI

logo_cnrs-tn_cnrslogo_limsi-logo-icone-siteLaboratoire de recherche en Informatique pluridisciplinaire, le LIMSI rassemble des chercheurs et enseignants-chercheurs relevant des Sciences de l’Ingénieur et des Sciences de l’Information ainsi que des Sciences du Vivant et des Sciences Humaines et Sociales. Le champ scientifique ainsi couvert est celui du traitement automatique de la langue, parlée, écrite et signée depuis le traitement du signal acoustique jusqu’à la modélisation sémantique, de l’interaction homme machine, la réalité virtuelle et augmentée ainsi que la mécanique des fluides et des transferts, et l’énergétique.

Le groupe ILES du LIMSI-CNRS possède une expérience reconnue dans la recherche d’informations précises (recherche de réponses à des questions), l’extraction d’informations et le traitement de la langue médicale. Les méthodes étudiées dans ce thème concernent deux principaux champs d’étude :

  • Extraction d’information : reconnaissance et typage d’informations pour construire des bases de connaissance ou analyser des textes
  • Recherche d’information précise : retrouver des informations dans des textes ou des bases de connaissance en réponse à des questions en langue naturelle

Thèmes développés :

  • Reconnaissance d’entités nommées en domaine général et en domaine de spécialité (biomédical essentiellement), reconnaissance de types complexes, prise en compte du phénomène de rareté lexicale
  • Extraction de relation en domaine général et en domaine de spécialité (biomédical essentiellement), avec des approches supervisées et non supervisées, fondée sur des informations de surface et des représentations structurées
  • Reconnaissance d’événements et d’information temporelle, extraction de chronologies
  • Détection d’opinion : construction de lexiques
  • Représentation et inférence sémantique pour répondre à des questions sur des textes et l’interrogation de bases de connaissances