Actualités

  • Les corpus d’Orfeo sont interrogeables avec Grew-match
  • Les corpus CEFC et CEFC-GOLD issus du projet Orfeo sont publiés sur Ortolang (licence BY-NC-SA)
  • Participation au datapol du medialab avec Zakarya Deprès et Julien Longhi. Projet « Détection des messages idéologiques »
  • SEM, l’étiqueteur du LaTTiCe pour le français, est en ligne : apps.lattice.cnrs.fr/sem
    • pos tagging, chunking, détection d’entités nommées
    • export en html, conll (tsv), json et txt)

Publications

Voir CV HAL

Projets

En cours

  • Oupoco
  • Approches contrastives du français, dir. Laure Sarda, Labex Transfers, en partenariat avec le département de français de l’université de Berkeley

Terminés

  • ANR Orfeo (dir. Jeanne-Marie Debaisieux)
  • ANR OmanSam (dir. Sabrina Bendjaballah)
  • ERC LIBGLOSS (dir. Anne Grondeux)

Enseignements

Formations

  • Annis pour interrogation de corpus annotés. Lundi 14 novembre 2016, Paris, consortium CORLI. [PDF]
  • Utiliser les données ouvertes (open data). Mardi 15 novembre 2016. ANF collecter et produire des données pour la recherche en SHS, Fréjus, MATE-SHS. [PDF]