INALCO

ERTIML’Institut National des Langues et Civilisations Orientales est un Grand Établissement d’enseignement et de recherche où sont enseignées plus de 90 langues. L’INALCO compte 10 000 étudiants et 500 enseignants-chercheurs. Il est membre du Pôle de Recherche et d’Enseignement Supérieur (PRES) Paris Sorbonne Cité. Fondée en 1986, l’Equipe de Recherche en Textes, Informatique, Multilinguisme (EA 2520 ERTIM, anciennement CRIM) est une équipe de recherche de l’INALCO. La plupart de ses travaux relèvent de la fouille de textes, l’extraction de données linguistiques (terminologies, lexiques) et le filtrage de documents, le plus souvent dans un contexte multilingue.

Les problématiques sont :

  • Lexicologie computationnelle multilingue (Dictionnaires PUF, collection e-lexiques)
  • Acquisition, traitement de corpus de spécialités et multilingues et multi-écritures (méthodes et outils) (Ecritures du Monde, Ministère de la culture)
  • Acquisition et structuration de lexiques et terminologies/ontologies (méthodes et outils) sur corpus numériques mono et multilingues (projet RNRT SAFIR)
  • Fouille de textes sur le Web (détection, filtrage automatique de données textuelles) à l’aide de leur caractérisation multi-critères (projet Safer Internet PRINCIP, projet ANR C-MANTIC, projet ANR VIGITERMES)
  • Extraction de données terminologiques à partir de corpus comparables (projets TCAN-PERTOMED et TCAN-DECO)
  • Évaluation de techniques d’alignement de corpus parallèles (projet Technolangues EVALDA)

L’ERTIM dispose d’une expertise importante à la fois dans le traitements de données sanitaires et médicales issues de documents structurés ou non structurés, en raison d’une forte participation à des projets partenariaux internationaux et nationaux (projets DECO, PERTOMED, VIGITERMES, C-MANTIC). Dans le cadre de projets de recherche et de conventions CIFRE, l’équipe a établi de nombreux partenariats avec des laboratoires publics français (LIP6, LIMSI, LINA, LORIA, LIM&BIO, INSERM, etc.), internationaux (Dublin City University, Universität Magdeburg, etc.) et industriels (EDF, XEROX, ARISEM, TEMIS, MONDECA, AMI Software, ELDA, PUF, Asiathèque, etc.).