logo democratProjet ANR DEMOCRAT
  • image01
  • image02
  • image03
  • image04

Laboratoires partenaires

  • Lattice
  • Icar
  • Ihrim
  • Lilpa

Organismes tutelles

  • CNRS
  • ANR

Présentation

DEMOCRAT vise à développer les recherches sur la langue et la structuration textuelle du français via l’analyse détaillée et contrastive des chaînes de référence (instanciations successives d’une même entité) dans un corpus diachronique de textes écrits entre le 9ème et le 21ème siècle, avec des genres textuels variés.

Le projet mettra à disposition de la communauté scientifique :

  1. Un modèle intégré et discursif de la référence et de la composition des chaînes de référence.
  2. Un corpus annoté qui puisse servir de corpus de référence et de corpus d’apprentissage pour les campagnes d’évaluation internationales portant sur la coréférence.
  3. Un outil d’annotation, d’aide à l’annotation et de manipulation des données annotées.
  4. Un système de détection automatique des coréférences.

Le corpus annoté manuellement en chaînes de référence aura une taille de
1 million de mots, soit environ 100 000 maillons annotés.

Laboratoires publics partenaires

LATTICE (Responsable Frédéric Landragin)

LILPA (Responsable Catherine Schnedecker)

ICAR/IHRIM (Responsable Céline Guillot-Barbance)

Lien vers la page du projet sur le site de l’ANR : Site ANR
Lien vers le Wiki de travail du projet : Wiki de travail

Haut de page