14 Janvier 2020 – Bruno Guillaume

Conversion et améliorations de corpus du français annotés en Universal Dependencies

Résumé : Nous décrivons l’effort d’amélioration des corpus du français annotés en dépendances syntaxiques dans le cadre du projet Universal Dependencies (UD, https://universaldependencies.org) qui vise à élaborer un schéma d’annotation syntaxique permettant d’analyser de façon similaire plusieurs langues différentes. Nous avons cherché à rendre plus conformes au schéma UD les corpus du français, et nous avons évalué l’impact des modifications apportées aux corpus sur la conformité avec le schéma UD et la cohérence interne de leur annotation. Nous décrirons également l’outil Grew (http://grew.fr) basé sur la réécriture de graphes qui a été utilisé dans ces différentes tâches. Ce travail a été fait en collaboration avec Marie-Catherine de Marneffe et Guy Perrier.