Laboratoire Lattice - UMR 8094
ENS-CNRS
1 rue Maurice Arnoux, 92120 Montrouge
Sujet de thèse
Adaptation et combinaison des modèles pour l’annotation de textes multi-source multi-domaine;
Postagging et extraction d’entités nommées de textes avec les CRFs;
Normalisation des textes avec les réseaux de neurones.
Directeur de thèse
Thierry Poibeau
Co-encadrant de thèse
Marco Dinarelli
Publications
Communications avec actes dans un congrès national
Tian, Dinarelli, Cardoso, Tellier: Détection des mots non-standards dans les tweets avec des réseaux de neurones, Traitement Automatique des Langues Naturelles (TALN 2017, papier court, poster), Orléans.
Tian, Dinarelli, Tellier, Cardoso 2015 : Etiquetage morpho-syntaxique de tweets avec des CRF, Traitement Automatique des Langues Naturelles (TALN 2015, papier court, poster), Caen.
Marty, Tian, Tellier 2014 : Extraction de propriétés de produits, Conférence en Recherche d’Information et Applications (CoRIA 2014), Nancy.
Communications dans un congrès international sans actes
Tian, Tellier, Dinarelli 2016 : Understanding Social Media Texts with Minimum Human Effort on #Twitter, PLIN Linguistic Day, Louvain-la-Neuve (Belgium).
Communications (orale ou par poster) avec actes dans un congrès international
Tian, Dinarelli, Tellier, Cardoso 2016 : Domain Adaptation for Named Entity Recognition Using CRFs, LREC, Portoroz (Slovenia).
Tian, Dinarelli, Tellier 2015 : Lattice: Data Adaptation for Named Entity Recognition on Tweets with Features-Rich CRF, Shared task on the 2015 Workshop on Noisy User-generated Text: Twitter Lexical Normalization and Named Entity Recognition, ACL Workshop, Beijing (China), 2015.
Enseignement
2018-2019: Poste ATER, Université Paris-Sorbonne. Programmation en Java; Langage Python; Certificat informatique et internet
2013- 2014: Chargée de cours, Université Paris Sorbonne Nouvelle. Initiation à la programmation; Langage Python; shell Unix