Mardi 25 février, au 45 rue d’Ulm, salle R (2eme sous-sol aile Rataud), de 10h30 à 12h00.
Chloé Braud (CNRS Loria)
L’analyse discursive automatique face au manque de données
L’analyse discursive vise à décrire l’organisation des documents à partir de relations dites discursives ou rhétoriques (comme Explication, Élaboration ou Contraste) liant des phrases et des clauses. Ces liens organisent un texte en un ensemble cohérent qui fait sens. Bien que cruciale pour des applications nécessitant de comprendre un document, le développement d’analyseur discursif est encore limité et se heurte notamment à un manque de données. Différents corpus ont été annotés pour le niveau discursif, mais ils sont généralement de petite taille et, par ailleurs, suivent des cadres théoriques et schémas d’annotation différents.
Je présenterai des expérimentations sur trois tâches de l’analyse discursive : segmentation, identification des relations implicites et parsing. Ces travaux ont en commun d’explorer des approches visant à gérer le manque de données. Elles reposent sur des questionnements comme le type d’information linguistique nécessaire pour une tâche discursive, la nature des relations discursive ou les similarités entre les langues pour ce niveau d’analyse.
Ces travaux sont issus de collaborations avec . Philippe Muller, Mathieu Morey, Charlotte Roze, Pascal Denis, Mikel Iruskieta, Maximin Coavoux, Anders Sogaard et Ophélie Lacroix.